次の方法で共有


クイック スタート: 開発環境を MLflow に接続する

このページでは、MLflow 実験を作成し、開発環境をそれに接続する方法について説明します。

MLflow 実験は、Gen AI アプリケーションのコンテナーです。 MLflow 実験の詳細については、 実験データ モデル の概念ガイドを参照してください。

開発環境に関連するセクションに移動します。

  1. IDE またはノートブックでローカルに
  2. Databricks でホストされるノートブック

ローカル開発環境

手順 1: MLflow をインストールする

Databricks 接続を使用して MLflow をインストールします。

pip install --upgrade "mlflow[databricks]>=3.1"

手順 2: MLflow 実験を作成する

  1. Databricks ワークスペースを開きます。
  2. 左側のサイドバーの [AI/ML] で、[ 実験] をクリックします。
  3. [実験] ページの上部にある [ GenAI アプリとエージェント] をクリックします。

実験を作成する

手順 3: 認証を構成する

これらの手順では、Databricks 個人用アクセス トークンの使用について説明します。 MLflow は、 Databricks でサポートされている他の認証方法でも機能します。

次のいずれかの認証方法を選択します。

環境変数

  1. MLflow 実験で、[ API キーの生成] をクリックします。
  2. 生成されたコードをターミナルでコピーして実行します。
export DATABRICKS_TOKEN=<databricks-personal-access-token>
export DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
export MLFLOW_TRACKING_URI=databricks
export MLFLOW_EXPERIMENT_ID=<experiment-id>

.env ファイル

  1. MLflow 実験で、[ API キーの生成] をクリックします。
  2. 生成されたコードをプロジェクト ルートの .env ファイルにコピーします。
DATABRICKS_TOKEN=<databricks-personal-access-token>
DATABRICKS_HOST=https://<workspace-name>.cloud.databricks.com
MLFLOW_TRACKING_URI=databricks
MLFLOW_EXPERIMENT_ID=<experiment-id>
  1. python-dotenv パッケージのインストール:
pip install python-dotenv
  1. コードに環境変数を読み込みます。
# At the beginning of your Python script
from dotenv import load_dotenv

# Load environment variables from .env file
load_dotenv()

手順 4: 接続を確認する

テスト ファイルを作成し、次のコードを実行して接続を確認し、テスト トレース を MLflow 実験に記録します。

import mlflow
import os

experiment_id = os.environ.get("MLFLOW_EXPERIMENT_ID")
databricks_host = os.environ.get("DATABRICKS_HOST")
mlflow_tracking_uri = os.environ.get("MLFLOW_TRACKING_URI")

if experiment_id is None or databricks_host is None or mlflow_tracking_uri is None:
    raise Exception("Environment variables are not configured correctly.")

@mlflow.trace
def hello_mlflow(message: str):

    hello_data = {
        "experiment_url": f"{databricks_host}/mlflow/experiments/{experiment_id}",
        "experiment_name": mlflow.get_experiment(experiment_id=experiment_id).name,
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

Databricks でホストされるノートブックで開発する

手順 1: ノートブックを作成する

Databricks Notebook を作成すると、GenAI アプリケーションのコンテナーである MLflow 実験が作成されます。 実験の詳細については、 データ モデルに関するページを参照してください。

  1. Databricks ワークスペースを開きます。
  2. 左側のサイドバーの上部にある [ 新規 ] に移動します。
  3. [ ノートブック] をクリックします。

手順 2: MLflow をインストールする

Databricks ランタイムには MLflow が含まれていますが、GenAI 機能を最大限に活用するには、最新バージョンに更新してください。

%pip install --upgrade "mlflow[databricks]>=3.1"
dbutils.library.restartPython()

手順 3: 認証を構成する

Databricks Notebook 内で作業する場合、追加の認証構成は必要ありません。 ノートブックは、ワークスペースと関連する MLflow 実験に自動的にアクセスできます。

手順 4: 接続を確認する

ノートブック セルでこのコードを実行して、接続を確認します。 ノートブック セルの下に MLflow トレースが表示されます。

import mlflow
import os

@mlflow.trace
def hello_mlflow(message: str):
    hello_data = {
        "message": message,
    }
    return hello_data

result = hello_mlflow("hello, world!")
print(result)

hello mlflow

次のステップ

これらの推奨されるアクションとチュートリアルを使用して、体験を続けます。

リファレンス ガイド

このガイドで説明されている概念と機能の詳細なドキュメントを確認します。