次の方法で共有


推論用に微調整されたモデルをデプロイする

モデルを微調整したら、デプロイして、独自のアプリケーションで使用できます。

モデルをデプロイする際は、モデルを推論に使用できるようにしますが、これには、1 時間ごとのホスティング料金が発生します。 ただし、微調整されたモデルは、使用する準備ができるまで、Azure AI Foundry に無料で格納できます。

Azure OpenAI では、さまざまなビジネスパターンと使用パターンに適合するホスティング構造上の微調整されたモデルのデプロイの種類 ( StandardGlobal Standard (プレビュー)、 プロビジョニングスループット (プレビュー) ) の選択肢が提供されます。 詳細については、微調整されたモデルのデプロイの種類およびすべてのデプロイの種類の概念に関する記事を参照してください。

微調整されたモデルをデプロイする

カスタム モデルをデプロイするには、デプロイするカスタム モデルを選択し、[デプロイ] を選択します。

[モデルのデプロイ] ダイアログ ボックスが開きます。 このダイアログ ボックスで [デプロイ名] を入力し、[作成] を選択して、カスタム モデルのデプロイを開始します。

Azure AI Foundry ポータルでカスタム モデルをデプロイする方法を示すスクリーンショット。

デプロイの進行状況は、Azure AI Foundry ポータルの [デプロイ] ペインで監視できます。

リージョン間でのデプロイは、UI ではサポートされていませんが、Python SDK または REST ではサポートされています。

重要

カスタマイズしたモデルをデプロイした後、デプロイが 15 日間を超えて非アクティブのままである場合、デプロイは削除されます。 カスタマイズされたモデルのデプロイは、モデルが 15 日以上前にデプロイされ、15 日間連続して完了またはチャット完了の呼び出しが行われなかった場合、"非アクティブ" になります。

非アクティブなデプロイは削除されても、基になるカスタマイズしたモデルは削除されず、影響を受けることもありません。カスタマイズしたモデルはいつでも再デプロイできます。 Azure AI Foundry Models の価格に関する Azure OpenAI で説明されているように、デプロイされるカスタマイズされた (微調整された) 各モデルでは、完了またはチャット完了の呼び出しがモデルに対して行われているかどうかに関係なく、1 時間ごとのホスティング コストが発生します。 Azure OpenAI を使用したコストの計画と管理の詳細については、「Azure OpenAI のコストを管理する計画」のガイダンスを参照してください。

デプロイ済みの微調整されたモデルを使用する

カスタム モデルは、デプロイ後、他のデプロイ済みモデルと同様に使用できます。 Azure AI Foundry ポータル[プレイグラウンド] を使用して、新しいデプロイを試すことができます。 カスタム モデルでは、他のデプロイ済みモデルと同様に、temperaturemax_tokens などの同じパラメーターを引き続き使用できます。

セクションが強調表示されている、Azure AI Foundry ポータル内の [プレイグラウンド] ペインのスクリーンショット。

プロンプト キャッシュ

Azure OpenAI の微調整では、一部のモデルでプロンプト キャッシュをサポートしています。 プロンプト キャッシュを使用すると、プロンプトの先頭に同じ内容が含まれている長いプロンプトについて、要求の全体的な待機時間とコストを削減できます。 プロンプト キャッシュの詳細については、プロンプト キャッシュの概要に関するページを参照してください。

デプロイの種類

Azure OpenAI の微調整では、次の種類のデプロイがサポートされています。

スタンダード

Standard デプロイは、呼び出し単位の支払いの課金モデルが提供され、各リージョンで使用できるモデルとスループットは、制限される場合があります。

モデル リージョン
GPT-4o-finetune 米国東部 2、米国中北部、スウェーデン中部
gpt-4o-mini-2024-07-18 米国中北部、スウェーデン中部
GPT-4-finetune 米国中北部、スウェーデン中部
GPT-35-Turbo-finetune 米国東部 2、米国中北部、スウェーデン中部、スイス西部
GPT-35-Turbo-1106-finetune 米国東部 2、米国中北部、スウェーデン中部、スイス西部
GPT-35-Turbo-0125-finetune 米国東部 2、米国中北部、スウェーデン中部、スイス西部

グローバル標準

Global Standard 微調整デプロイを選択すると、コスト削減を図ることができますが、カスタム モデルの重みは、Azure OpenAI リソースの地理的な場所の外部に一時的に格納される場合があります。

モデル リージョン
GPT-4.1-ファインチューン 米国東部 2、米国中北部、スウェーデン中部
GPT-4.1-mini-finetune 米国東部 2、米国中北部、スウェーデン中部
GPT-4.1-nano-finetune(GPT-4.1のナノファインチューニング) 米国東部 2、米国中北部、スウェーデン中部
GPT-4o-finetune 米国東部 2、米国中北部、スウェーデン中部
GPT-4o-mini-finetune 米国東部 2、米国中北部、スウェーデン中部

微調整されたモデルを使用した Global standard デプロイのユーザー エクスペリエンスのスクリーンショット。

プロビジョニングされたスループット

モデル リージョン
GPT-4o-finetune 米国中北部、スウェーデン中部
GPT-4o-mini-finetune 米国中北部、スウェーデン中部

プロビジョニングされたスループット の微調整されたデプロイは、待機時間の影響を受けやすいエージェントとアプリケーションに 対して予測可能なパフォーマンス を提供します。 ベース モデルと同じリージョン プロビジョニング スループット (PTU) 容量が使用されるため、リージョン PTU クォータが既にある場合は、微調整されたモデルをサポート リージョンにデプロイできます。

デプロイをクリーンアップする

デプロイを削除するには、Deployments - Delete REST API を使用して、デプロイ リソースに HTTP DELETE を送信します。 デプロイの作成時と同様に、次のパラメーターを含める必要があります。

  • Azure サブスクリプション ID
  • Azure リソース グループ名
  • Azure OpenAI リソースの名前
  • 削除するデプロイの名前

デプロイを削除する REST API の例を次に示します。

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>api-version=2024-10-21" \
  -H "Authorization: Bearer <TOKEN>"

デプロイは、Azure AI Foundry ポータルで削除することもできます。また、Azure CLI を使用することもできます。

次のステップ