モザイクAIエージェント評価チュートリアルノートブック

次のノートブックは、Agent Evaluation の独自の LLM ジャッジ、カスタムメトリック、およびドメインエキスパートのラベルを使用して、Gen AI アプリを評価する方法を示しています。次の例を示します。

エージェントを実稼働前に準備するには、 Mosaic AI エージェントのデモノートブックを参照してください。一般的な情報については、「モザイク AI エージェントの評価 (MLflow 2)」を参照してください。

フィードバック