紹介
機械学習では、モデルは、既知のラベルとトレーニング データ内の特徴の間の相関関係に基づいて、新しいデータの不明なラベルを予測するようにトレーニングされます。 使用するアルゴリズムによっては、モデルのトレーニング方法を構成するために、ハイパーパラメーター 指定する必要がある場合があります。
たとえば、ロジスティック回帰 アルゴリズムでは、ハイパーパラメーター 正則化率を使用してオーバーフィットに対抗します。畳み込みニューラル ネットワーク (CNN) のディープ ラーニング手法では、学習速度 などのハイパーパラメーターを使用してトレーニング中の重みの調整方法を制御し、バッチ サイズ を して各トレーニング バッチに含まれるデータ項目の数を決定します。
手記
Machine Learning は、独自の特定の用語を持つ学術分野です。 データ サイエンティストは、トレーニング機能から決定された値を パラメーターと呼ぶので、トレーニング動作の構成に使用される値には別の用語が必要ですが、トレーニング データから派生ないため、ハイパーパラメーター という用語です。
ハイパーパラメーター値の選択は、結果のモデルに大きく影響する可能性があるため、特定のデータと予測パフォーマンスの目標に最適な値を選択することが重要です。
ハイパーパラメーターのチューニング
ハイパーパラメーター調整 は、同じアルゴリズムとトレーニング データを使用して複数のモデルをトレーニングし、異なるハイパーパラメーター値を使用して行います。 次に、各トレーニング実行から得られたモデルが評価され、最適化するパフォーマンス メトリック (精度など) が決定され、最適なパフォーマンス モデルが選択されます。
Azure Machine Learning では、スクリプトを スイープ ジョブとして送信することで、ハイパーパラメーターを調整できます。 スイープジョブは、テストするハイパーパラメーターの組み合わせごとに、トライアル を 実行します。 各試用版では、パラメーター化されたハイパーパラメーター値を含むトレーニング スクリプトを使用してモデルをトレーニングし、トレーニング済みモデルによって達成されたターゲット パフォーマンス メトリックをログに記録します。
学習目標
このモジュールでは、次の方法を学習します。
- ハイパーパラメーター検索スペースを定義します。
- ハイパーパラメーター サンプリングを構成します。
- 早期終了ポリシーを選択します。
- 一括処理を実行します。