Hyperopt による分散トレーニングのアルゴリズムを使用する

2025-05-10

注

Hyperopt のオープンソースバージョンはメンテナンスされなくなりました。

Hyperopt は、次のメジャー DBR ML バージョンで削除されます。 Azure Databricks では、単一ノードの最適化に Optuna を使用するか、非推奨の Hyperopt 分散ハイパーパラメーター調整機能と同様のエクスペリエンスを実現するために RayTune をすることをお勧めします。 Azure Databricks で RayTune を使用する方法について説明します。

scikit-learn のアルゴリズムなどの単一マシントレーニングアルゴリズムに加えて、分散トレーニングアルゴリズムで Hyperopt を使用することもできます。このシナリオでは、Hyperopt は、ドライバーノード上のさまざまなハイパーパラメーター設定を使用して試用版を生成します。各試用版は、ドライバーノードから実行され、完全なクラスターリソースへのアクセスを提供します。この設定は、Apache Spark MLlib や HorovodRunner など、すべての分散機械学習アルゴリズムまたはライブラリで機能します。

分散トレーニングアルゴリズムで Hyperopt を使用する場合は、に trials 引数を fmin() に渡さないでください。具体的には、SparkTrials クラスを使用しないでください。 SparkTrials は、自身が分散されていないアルゴリズムの試用版を分散するように設計されています。分散トレーニングアルゴリズムでは、クラスタードライバーで実行される既定の Trials クラスを使用します。 Hyperopt は、ML アルゴリズム自体が分散トレーニングを開始できるように、ドライバーノードの各試用版を評価します。

注

Azure Databricks は、Trials クラスを使用した MLflow への自動ログ記録をサポートしていません。分散トレーニングアルゴリズムを使用する場合は、Hyperopt の試用版をログに記録するために MLflow を手動で呼び出す必要があります。

ノートブックの例: MLlib アルゴリズムでの Hyperopt の使用

サンプルノートブックは、Hyperopt を使用して MLlib の分散トレーニングアルゴリズムを調整する方法を示しています。

Hyperopt および MLlib 分散トレーニングノートブック

ノートブックを入手

ノートブックの例: HorovodRunner での Hyperopt の使用

HorovodRunner は、Databricks で分散ディープラーニングワークロードを実行するために使用される汎用 API です。 HorovodRunner は、Horovod と Spark のバリアモードを統合して、Spark で実行時間の長いディープラーニングトレーニングジョブの安定性を高めます。

この例のノートブックでは、HorovodRunner に基づいてディープラーニングの分散トレーニングを調整するための Hyperopt の使用方法を示しています。

Hyperopt と HorovodRunner 分散トレーニングノートブック

ノートブックを入手

次の方法で共有

Hyperopt による分散トレーニングのアルゴリズムを使用する

ノートブックの例: MLlib アルゴリズムでの Hyperopt の使用

Hyperopt および MLlib 分散トレーニング ノートブック

ノートブックの例: HorovodRunner での Hyperopt の使用

Hyperopt と HorovodRunner 分散トレーニング ノートブック

フィードバック

その他のリソース

Hyperopt および MLlib 分散トレーニングノートブック

Hyperopt と HorovodRunner 分散トレーニングノートブック