このページでは、MLflow 実験を作成し、開発環境をそれに接続する方法について説明します。
MLflow 実験は、Gen AI アプリケーションのコンテナーです。 MLflow 実験の詳細については、 実験データ モデル の概念ガイドを参照してください。
開発環境に関連するセクションに移動します。
ローカル開発環境
手順 1: MLflow をインストールする
Databricks 接続を使用して MLflow をインストールします。
pip install --upgrade "mlflow[databricks]>=3.1"
手順 2: MLflow 実験を作成する
- Databricks ワークスペースを開きます。
- 左側のサイドバーの [AI/ML] で、[ 実験] をクリックします。
- [実験] ページの上部にある [ GenAI アプリとエージェント] をクリックします。
手順 3: 認証を構成する
注
これらの手順では、Databricks 個人用アクセス トークンの使用について説明します。 MLflow は、 Databricks でサポートされている他の認証方法でも機能します。
次のいずれかの認証方法を選択します。
環境変数
- MLflow 実験で、[ API キーの生成] をクリックします。
- 生成されたコードをターミナルでコピーして実行します。
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_EXPERIMENT_ID=<experiment-id>
.env ファイル
- MLflow 実験で、[ API キーの生成] をクリックします。
- 生成されたコードをプロジェクト ルートの
.env
ファイルにコピーします。
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_EXPERIMENT_ID=<experiment-id>
-
python-dotenv
パッケージのインストール:
pip install python-dotenv
- コードに環境変数を読み込みます。
# At the beginning of your Python script
from dotenv import load_dotenv
# Load environment variables from .env file
load_dotenv()
手順 4: 接続を確認する
テスト ファイルを作成し、次のコードを実行して接続を確認し、テスト トレース を MLflow 実験に記録します。
import mlflow
import os
experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")
if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
raise Exception("Environment variables are not configured correctly.")
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
"experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
Databricks でホストされるノートブックで開発する
手順 1: ノートブックを作成する
Databricks Notebook を作成すると、GenAI アプリケーションのコンテナーである MLflow 実験が作成されます。 実験の詳細については、 データ モデルに関するページを参照してください。
- Databricks ワークスペースを開きます。
- 左側のサイドバーの上部にある [ 新規 ] に移動します。
- [ ノートブック] をクリックします。
手順 2: MLflow をインストールする
Databricks ランタイムには MLflow が含まれていますが、GenAI 機能を最大限に活用するには、最新バージョンに更新してください。
%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()
手順 3: 認証を構成する
Databricks Notebook 内で作業する場合、追加の認証構成は必要ありません。 ノートブックは、ワークスペースと関連する MLflow 実験に自動的にアクセスできます。
手順 4: 接続を確認する
ノートブック セルでこのコードを実行して、接続を確認します。 ノートブック セルの下に MLflow トレースが表示されます。
import mlflow
import os
@mlflow.trace
def hello_mlflow(message: str):
hello_data = {
"message": message,
}
return hello_data
result = hello_mlflow("hello, world!")
print(result)
次のステップ
これらの推奨されるアクションとチュートリアルを使用して、体験を続けます。
- トレースを使用してアプリをインストルメント化する (IDE) - ローカル IDE で GenAI アプリに MLflow トレースを追加する
- トレースを使用してアプリをインストルメント化する (ノートブック) - Databricks Notebook に MLflow トレースを追加する
- アプリの品質を評価 する - アプリの品質を体系的にテストして改善する
リファレンス ガイド
このガイドで説明されている概念と機能の詳細なドキュメントを確認します。
- MLflow 実験 - GenAI アプリケーションの実験コンテナーを理解する
- トレースの概念 - MLflow トレースの基礎について学習する
- Databricks 認証 - 使用可能なすべての認証方法を調べる