Microsoft はプロビジョニングされたスループット オファリングの改善を開始しました。これは、使いやすさと運用の機敏性に関するお客様からのフィードバックに対応するものであり、新たな支払いオプションとデプロイ シナリオが可能になります。
この記事は、既存のプロビジョニング スループット オファリング ユーザーを対象としています。 新規のお客様は、Azure OpenAI プロビジョニングのオンボーディング ガイドについての記事を参照してください。
変更点
重要
この記事は、2024 年 8 月と 12 月に Provisioned Managed オファリングに加えられた変更に伴い変更されています。 この変更は、以前の "Provisioned Classic (PTU-C)" オファリングには適用されません。 これらは、Provisioned (Provisioned Managed とも呼ばれます) オファリングにのみ影響します。
操作性の向上
特徴 | メリット |
---|---|
モデルに依存しないクォータ | すべてのモデル/バージョンをカバーする単一のクォータ制限により、クォータ管理が軽減され、新しいモデルでの実験が高速化されます。 |
セルフサービス クォータ要求 | 営業チームの関与なく、クォータの引き上げを要求します。多くは自動承認されます。 |
多くのリージョンにおいて、既定でプロビジョニング済みのマネージド クォータ | 最初にクォータを要求することなく、すばやく開始できます。 |
リアルタイムな使用可能容量に関する透過的な情報 + 新しいデプロイ フロー | 可用性に関するネゴシエーションが削減でき、市場投入までの時間が短縮されます。 |
データ ゾーン プロビジョニング済みデプロイ | Azure のグローバル インフラストラクチャを利用して、要求ごとに最適な可用性を備えた Microsoft 定義データ ゾーン内のデータ センターにトラフィックを動的にルーティングできます。 詳細については、 デプロイの種類 に関する記事を参照してください。 |
新しい時間単位または予約用の商用モデル
特徴 | メリット |
---|---|
バインドなしの時間単位のオプション | バインドなしの時間単位の支払いオプションを使用すると、短期間でのデプロイ シナリオが可能になります。 新しいモデルをテストし、プロビジョニングされたスループットの利点を評価するのに最適です。 |
Azure Reservations を使用した期間割引 | Azure Reservations では、1 か月と 1 年間の期間の場合、時間制より大幅な割引が提供されます。また、柔軟なスコープを提供することで、現在のリソースに縛られたコミットメントに関連する管理作業を最小限に抑えます。 |
多くのリージョンにおいて、既定でプロビジョニング済みのマネージド クォータ | 最初にクォータを要求することなく、新しいリージョンですばやく作業を開始できます。 |
既にプロビジョニング済みのお客様に対する柔軟な支払いモデルの選択 | コミットメントを持つお客様は、現在サポートされているモデルの有効期間が終了するまでコミットメント モデルを使用できます。また、マネージド プロセスを使用して、既存のコミットメントを時間単位/予約に移行することを選択できます。 期間割引を利用し、最新のモデルを使用するには、時間単位/予約に移行することをお勧めします。 |
最新のモデル世代をサポート | 最新のモデルは、提供されたサービスの時間ごとの予約でのみ利用できます。 |
差別化された価格 | 価格とパフォーマンスの柔軟性と制御の向上。 2024 年 12 月には、追加の割引をサポートするために Azure Reservations を購入するオプションを使用して、グローバル プロビジョニング済み、プロビジョニング済みデータ ゾーン、リージョンプロビジョニング済みデプロイの種類に対して、差別化された時間単位の価格が導入されました。 プロビジョニングされた各展開の種類の時間単位の価格の詳細については、「価格の 詳細 」ページを参照してください。 |
操作性向上の詳細
プロビジョニング済みのクォータの細分性は、モデル固有からモデルに依存しないレベルに変化しています。 サブスクリプションとリージョン内の各モデルとバージョンが独自のクォータ制限を持つのではなく、サブスクリプションとリージョンごとに単一のクォータ項目があり、サポートされているすべてのモデルとバージョンにデプロイできる PTU の合計数が制限されます。
モデルに依存しないクォータ
2024 年 8 月 12 日の時点で、既存のお客様の現在のモデル固有のクォータが、モデルに依存しないクォータに変換されました。 これは自動的に行われます。 切り替えに伴い、クォータが失われることはありません。 既存のクォータ制限が合計され、新しいモデルに依存しないクォータ項目に割り当てられます。
新しいモデルに依存しないクォータは、プロビジョニング済みのマネージド スループット ユニットという名前のクォータ項目として表示され、モデルとバージョンは名前に含まれません。 Azure AI Foundry の [クォータ] ウィンドウで、クォータ項目を展開すると、クォータ項目に関係するすべてのデプロイが表示されます。
既定のクォータ
新規および既存のサブスクリプションには、多くのリージョンでわずかなプロビジョニング済みクォータが割り当てられます。 これにより、お客様は最初にクォータを要求することなく、これらのリージョンの使用を開始できます。
既存のお客様でリージョンに既にクォータの割り当てが含まれている場合、そのリージョンのクォータ制限は変更されません。 この場合、自動的に新しい規定の金額が増えるわけではありません。
セルフサービス クォータ要求
お客様は販売チームに問い合わせてクォータを取得できなくなりました。 代わりに、セルフサービス クォータ要求フォームを使用し、PTU マネージド クォータの種類を指定します。 フォームには、クォータ項目の右側のリンクからアクセスできます。 目標は、2 営業日以内にすべてのクォータ要求に応答することです。
次のクォータのスクリーンショットは、さまざまな種類のデプロイで使用されているモデルに依存しないクォータと、追加のクォータを要求するためのリンクを示しています。
制限としてのクォータ
8 月の更新プログラム以前、プロビジョニング済み Azure OpenAI は少数のお客様のみが利用でき、デプロイして使用する機能を最大限に活用するようクォータが割り当てられていました。 これらの変更により、すべてのユーザーに対してクォータを取得するプロセスが簡略化され、デプロイを試みた場合にサービス容量の制限が発生する可能性が高くなります。 新しい API とポータル エクスペリエンスを使用すると、サブスクリプションにクォータがあり、サービスが希望するモデルのデプロイをサポートする容量があるリージョンを見つけられます。
また、コミットメントをお使いのお客様は、コミットメントを作成または拡張する前にデプロイを作成することをお勧めします。 これにより、コミットメントを作成する前に容量を確保でき、コミットメントの過剰な購入の防止を保証します。 これをサポートするために、デプロイがコミットメントよりも大きく作成されることを防止していた制限が削除されました。 クォータ、使用可能な容量、コミットメントに対するこの新しいアプローチは、時間単位/予約モデルで提供されているものと一致し、コミットメント (または時間単位モデルの場合は予約) を購入する前にデプロイするガイダンスは両方で同じです。
詳細については、次のリンクをご覧ください。 予約とコミットメントのガイダンスは同じです。
新しい時間ごとに基づく予約支払いモデル
注
次の支払いモデルの説明は、以前の "Provisioned Classic (PTU-C)" オファリングには適用されません。 これらは、Provisioned (Provisioned Managed とも呼ばれます) オファリングにのみ影響します。 Provisioned Classic は、変わらない毎月のコミットメント支払いモデルによって引き続き管理されます。
Microsoft は、プロビジョニング済みデプロイ用の新しい "時間単位/予約" 支払いモデルを導入しました。 これは、現在サポートされている限定モデルリストの有効期間が終了するまで引き続きサポートされる、現在の コミットメント 支払いモデルに加えて行われます。 コミットメント支払いモデルでサポートされているモデルの一覧については、「コミットメント支払モデルでサポートされているモデル」を参照してください。 追加の割引をサポートするために、Azure の予約を購入するオプションもあります。
グローバルおよびデータ ゾーンのプロビジョニング済みデプロイの新しい Azure 予約
時間単位の支払いモデルの更新に加えて、2024 年 12 月には、グローバルデプロイタイプとデータ ゾーンプロビジョニングデプロイタイプ専用に新しい Azure 予約 が導入されました。 これらの新しい Azure 予約では、プロビジョニングされたすべてのデプロイの種類に個別の Azure 予約があり、追加の割引をサポートするために購入できます。 プロビジョニングされた各デプロイの種類と、関連付けられている Azure 予約のマッピングは次のとおりです:
プロビジョニング済みデプロイの種類 | コード内の SKU 名 | Azure 予約製品の名称 |
---|---|---|
グローバルに設定済み | GlobalProvisionedManaged |
プロビジョニング済みマネージド グローバル |
データ ゾーン プロビジョニング済み | DataZoneProvisionedManaged |
プロビジョニング済みマネージド データ ゾーン |
プロビジョニング済み | ProvisionedManaged |
プロビジョニングされた管理対象リージョン |
重要
Azure OpenAI プロビジョニング済みオファーの Azure 予約は、デプロイの種類間で交換可能ではありません。 購入した Azure 予約は、プロビジョニングされたデプロイの種類と一致する必要があります。 購入した Azure 予約がプロビジョニングされたデプロイの種類と一致しない場合、プロビジョニングされたデプロイは、一致する Azure 予約の製品が購入されるまで、既定で時間単位の支払いモデルになります。 詳細については、 Azure AI Foundry Models の Azure OpenAI の Azure Reservations プロビジョニングガイダンスを参照してください。
コミットメント支払モデル
プロビジョニング済みサービスを使用するには、地域ごとに月単位でのコミットメントが必要です(契約によりさらに長期間の利用も可能です)。
コミットメントは Azure OpenAI リソースにバインドされるため、リソース間でのデプロイの移動が困難になります。
コミットメントは、新しい PTU を追加する場合以外は、期間中に取り消す、または変更することはできません。
コミットメント支払いモデルでサポートされているモデル:
コミットメントでは、次に一覧した Azure OpenAI モデルのみがサポートされています。 以下のリストにないその他のモデルやプロビジョニング済みスループット提供での新しいモデルをオンボーディングするには、Azure OpenAI プロビジョニング済みオンボーディング ガイドおよび Azure OpenAI プロビジョニング済みデプロイのための Azure 予約を参照してください
コミットメント プランでサポートされているモデル | バージョン |
---|---|
gpt-35-turbo | 0125,1106 |
gpt-4 | 0613、1106-Preview、0125-Preview |
gpt-4-turbo | 2024年04月09日 |
gpt-4-32k | 0613 |
gpt-4o | 2024-05-13, 2024-08-06 |
gpt-4o-mini | 2024年07月18日 |
時間単位の予約支払いモデル
支払いモデルは、他の製品の Azure 標準に合わせて調整されています。
時間単位の使用は、コミットメントなしでサポートされます。
1 か月と 1 年間の期間割引は、リージョンの Azure Reservations として購入できます。
予約は複数のサブスクリプションに対応するようにスコープを柔軟に設定できます。また、スコープは中期的に変更できます。
古いモデルと新しいモデルの両方をサポートします。
重要
より多くの最新モデルは、時間単位/予約支払いモデルを使用してプロビジョニングオファリングで利用できます。 上記の一覧に記載されていない可用性モデルのうち、アクティブなコミットメントが含まれる Azure OpenAI リソースにデプロイできないものについては、こちらのリストを確認してください。 新しいモデルをデプロイするには、次のいずれかを行う必要があります。
- コミットメントなしで Azure OpenAI リソースにデプロイを作成します。
- 既存のリソースをコミットメントから移行します。
支払いモデル フレームワーク
時間単位または予約支払いモデルのリリースにより、支払いオプションの柔軟性が向上し、プロビジョニングの支払いに関するモデルが変更されました。 プロビジョニングを購入する唯一の方法が 1 か月のコミットメントであったときは、モデルは次のとおりでした。
- Microsoft アカウント チームから PTU クォータを取得します。
- デプロイを行うリソースへのコミットメントからクォータを "購入" します。
- コミットメントの制限に達するまで、リソースにデプロイメントを展開します。
このモデルと新しいモデルの主な違いは、以前はプロビジョニングに対する支払いの唯一の方法が 1 か月の期間割引だったことです。 現在は、選択すれば時間単位でデプロイしてデプロイ料金を支払うことができ、1 か月のコミットメント (以前と同様) または Azure 予約のいずれで割引を行うかについて、別個に決定できます。
この分析情報を使用して、支払いモデルについて考える新しい方法は次のとおりです。
- セルフサービス フォームを使用して PTU クォータを取得します。
- クォータを使ってデプロイを作成します。
- デプロイに期間割引を適用するために、必要に応じてコミットメントや予約を購入または延長することができます。
手順 1 と 2 は、すべての場合で同じです。 違いは、割引を提供する手段としてコミットメントと Azure 予約のどちらを使用するかです。 両方のモデルで次のようになります。
割引対象よりも多くの PTU をデプロイできます。 (たとえば、割引を購入せずにデプロイすることで、新しいモデルを試すための短期的なデプロイの作成が可能になります)
割引方法 (コミットメントまたは予約) は割引価格を固定数の PTU に適用し、どのデプロイが割引の対象としてカウントされるかを決めるスコープがあります。
割引タイプ 使用可能なスコープ (リージョン内) コミットメント Azure OpenAI リソース 予約 リソース グループ、単一サブスクリプション、管理グループ (サブスクリプションのグループ)、共有 (課金アカウント内のすべてのサブスクリプション) 割引価格は、割引での割引対象 PTU の数に達するまで、デプロイされた PTU に適用されます。
デプロイされた PTU の数が割引された PTU を超えた場合 (または割引の対象にならない場合) には、時間単位の料金が課金されます。
ベスト プラクティスは、最初にデプロイを作成してから、割引を適用することです。 これは、そのサービスを保証するためです。 容量は、使用できない PTU に対して期間契約を作成する前に、デプロイをサポートするために使用できます。
注
ベスト プラクティスに従うと、デプロイを作成してから割引 (コミットメントまたは予約) を引き上げるまでの時間単位の料金が発生する場合があります。
このため、デプロイの直後に割引を引き上げられるように準備することをお勧めします。 Azure 予約を購入するための前提条件は、コミットメントの場合とは異なります。デプロイの割引に使用する場合は、デプロイ前に検証することをお勧めします。 詳細については、「Azure の予約を表示および管理するためのアクセス許可」を参照してください
デプロイと割引方法のマッピング
2024 年 8 月より前のAzure OpenAI のプロビジョニングされたオファーを使用しているお客様は、サブスクリプション内で支払いモデルのどちらかを使用することも両方を同時に使用することもできます。 各デプロイに使用される支払いモデルは、Azure OpenAI リソースに基づいて決定されます。
リソースにアクティブなコミットメントがある
- コミットメントにより、リソースでのすべてのデプロイが、コミットメントの PTU の数まで割引されます。 余分な PTU がアクティブな予約のスコープにない限り、余分な PTU は 1 時間ごとに課金されます。 アクティブな予約のスコープに余分な PTU が存在している場合は、予約の PTU 数まではグループとして割引され、それでも残っている超過分については 1 時間ごとに課金されます。
リソースにアクティブなコミットメントがない
- リソースの下でのデプロイは、Azure 予約によって割引を受けることができます。 これらのデプロイが割引の対象となるには、アクティブな予約のスコープ内に存在する必要があります。 予約のスコープ内のすべてのデプロイ (同じまたは他のサブスクリプション内の他のリソースへのデプロイを含む) は、予約の PTU の数までグループとして割引されます。 超過した PTU は時間単位で課金されます。
既存の支払いモードを変更する
現在コミットメントを持っているお客様は、少なくともサポートされているモデルの提供終了まで引き続き使用できます。 これには、新規または既存のコミットメントでの新しい PTU の購入や、コミットメントの更新の管理が含まれます。 ただし、8 月の更新プログラムでは、コミットメント操作の特定の側面が変更されました。
Azure OpenAI では、2024 年 8 月 1 日より、新規コミットメントへの登録のサポートを停止しました
コミットメントのあるリソースにデプロイできるのは、限られたモデルのセットのみとなります。 モデルの一覧を次に示します
コミットメントの下でデプロイされた PTU がコミットされた PTU を超えた場合、新しい時間単位/予約支払いモデルに使用されたのと同じ時間単位のメーターに対して時間単位の超過料金が出力されます。 これにより、Azure Reservation を使用して超過料金を割引できます。
リソースに対してコミットされた数よりも多くの PTU をデプロイできます。 これにより、容量をカバーするコミットメントのサイズを増やす前に、使用可能な容量を保証する機能がサポートされます。
既存のリソースをコミットメントから移行する
既存のお客様は、既存のリソースをコミットメントから時間単位/予約の支払いモデルに移行することで最新モデルの導入によるメリットを享受するか、または多様なデプロイに対する割引を単一の予約に統合するかを選択できます。
コミットメント モデルを使用したリソースを時間単位/予約モデルに移行するには、2 つのアプローチがあります。
セルフサービス移行
セルフサービス移行アプローチを使用すると、お客様はコミットメントを自発的に期限切れにして、それに伴うリソースを自然に減少させることができます。 リソースを移行するプロセスは次のとおりです。
既存のコミットメントを自動更新しないように設定し、有効期限をメモします。
有効期限が切れる前に、お客様はサブスクリプションあたりのコミット済み PTU の合計数をカバーする Azure Reservation を購入する必要があります。 既存の予約のスコープにサブスクリプションが既にある場合は、新しい PTU をカバーするようにサイズを増やすことができます。
コミットメントの有効期限が切れると、リソースの下のデプロイは、予約によって割引された使用量で時間単位/予約モードに自動的に切り替わります。
このセルフサービス移行アプローチでは、予約とコミットメントの両方がアクティブとなる重複が発生します。 これはこの移行モードの特性であり、この重複の予約またはコミットメント時間については、お客様にクレジットが戻りません。
セルフサービス移行のもう 1 つのアプローチは、コミットメントの有効期限が切れた後に予約購入に切り替える方法です。 このアプローチでは、デプロイによって、コミットメントの有効期限と予約の購入の間で、時間単位の使用量が生成されます。 前のモデルと同様に、これはこのアプローチの特徴であり、この時間単位の使用量はクレジットされません。
セルフサービス移行の利点:
- 個々のリソースは、異なる時間に移行できます。
- お客様は、Microsoft に依存することなく移行を管理します。
セルフサービス移行の欠点:
- コミットから時間単位/予約課金への切り替え中に、二重請求または時間単位の料金が短期間発生します。
重要
セルフサービス アプローチでは、支払いモードが [コミット済み] から [時間単位/予約] に切り替えられるため、追加料金が発生します。 これは、当該移行アプローチの特性であり、お客様はこれらの料金に対してクレジットされません。
プロビジョニング済みのグローバルまたはデータ ゾーンへの既存のデプロイの移行
プロビジョニング済みデプロイの既存のお客様は、グローバルまたはデータ ゾーンのプロビジョニング済みデプロイに移行して、デプロイの最小数の削減、きめ細かなスケールの増分、またはこれらのデプロイの種類で利用できる差別化された価格の恩恵を受けることができます。 グローバル デプロイとデータ ゾーン プロビジョニング済みデプロイで Azure 地域全体のデータ処理を処理する方法の詳細については、Azure OpenAI デプロイ データ処理に関するドキュメントを参照してください。
お客様は、プロビジョニング済みデプロイからグローバル デプロイまたはデータ ゾーンプロビジョニング済みデプロイに移行するための 2 つの方法を使用できます。
ダウンタイムなしの移行
ダウンタイムなしの移行アプローチを使用すると、既存のプロビジョニング済みデプロイを、デプロイの既存の推論トラフィックを中断することなく、グローバルまたはデータ ゾーンでプロビジョニング済みデプロイに移行できます。 この移行アプローチでは、ワークロードの中断を最小限に抑えますが、トラフィックをシフトしながら、顧客が複数の共存デプロイを行う必要があります。 ダウンタイムなしの移行アプローチを使用してプロビジョニング済みデプロイを移行するプロセスは次のとおりです:
- ターゲットの Azure OpenAI リソースで、グローバルまたはデータ ゾーンでプロビジョニング済みデプロイの種類を使用して、新しいデプロイを作成します。
- すべてのトラフィックがリージョン プロビジョニング済みデプロイからオフロードされるまで、既存のリージョンのプロビジョニング済みデプロイの種類から新しく作成されたグローバルまたはデータ ゾーン プロビジョニング済みデプロイにトラフィックを移行します。
- トラフィックが新しいデプロイに移行されたら、Azure OpenAI 要求メトリックに、推論トラフィックが新しいデプロイに移行されてから 5 ~ 10 分以内に行われた API 呼び出しが表示されないようにすることで、前のプロビジョニング済みデプロイで処理される推論要求がないことを検証します。 このメトリックの詳細については、Azure OpenAI の監視に関するドキュメントを参照してください。
- 推論呼び出しが行われなかったことを確認したら、リージョンのプロビジョニング済みデプロイを削除します。
ダウンタイムのある移行
ダウンタイムを伴う移行アプローチでは、既存のプロビジョニング済みデプロイを、元のプロビジョニング済みデプロイで既存の推論トラフィックを停止しながら、グローバルまたはデータ ゾーンでプロビジョニング済みデプロイに移行する必要があります。 この移行方法では、サポートするために複数のデプロイを共存させる必要はありませんが、完了するにはワークロードの中断が必要です。 ダウンタイムを伴う移行アプローチを使用してプロビジョニング済みのデプロイを移行するプロセスは次のとおりです:
- Azure OpenAI 要求メトリックに過去 5 ~ 10 分以内に行われた API 呼び出しが表示されないようにすることで、前のプロビジョニングされたデプロイで推論要求が処理されていないことを検証します。 このメトリックの詳細については、Azure OpenAI の監視に関するドキュメントを参照してください。
- 推論呼び出しが行われなかったことを確認したら、リージョンのプロビジョニング済みデプロイを削除します。
- ターゲットの Azure OpenAI リソースで、グローバルまたはデータ ゾーンのデプロイの種類を使用して新しいデプロイを作成します。
- 新しいデプロイが成功したら、新しいグローバルまたはデータ ゾーンのデプロイで推論トラフィックを再開できます。
既存の Azure 予約を新しい Azure 予約の製品に移行するにはどうすればよいですか?
Azure OpenAI プロビジョニングオファーの Azure 予約は、プロビジョニングされたデプロイの種類に固有です。 購入した Azure 予約がプロビジョニング済みデプロイの種類と一致しない場合、デプロイは既定で時間単位の支払いモデルになります。 グローバルまたはデータ ゾーンのプロビジョニング済みデプロイに移行する場合は、追加の割引をサポートするために、これらのデプロイの新しい Azure 予約の購入が必要になる場合があります。 新しい Azure 予約を購入する方法、または既存の Azure 予約に変更を加える方法の詳細については、 Azure OpenAI プロビジョニングガイダンスの Azure Reservations を参照してください。
プロビジョニング スループット コミットメントの管理
プロビジョニングされたスループット コミットメントは、Azure AI Foundry ポータルのナビゲーション メニューで [管理センター] >[Quota>Manage Commitments] を選択することで作成および管理されます。
[コミットメントの管理] ビューでは、いくつかの操作を実行できます。
- 新しいコミットメントを購入するか、既存のコミットメントを編集します。
- サブスクリプション内のすべてのコミットメントを監視します。
- 予期しない課金を引き起こす可能性のあるコミットメントを特定し、アクションを実行します。
以下のセクションでは、これらのタスクについて説明します。
プロビジョニングされたスループットのコミットメントを購入する
コミットメント計画の準備ができたら、次の手順はコミットメントを作成することです。 コミットメントは Azure AI Foundry を使って手動で作成します。コミットメントを作成するユーザーには、サブスクリプション レベルで共同作成者または Cognitive Services 共同作成者のロールが必要です。
作成する必要がある新しいコミットメントごとに、以下の手順を実行します。
- [クォータ]>[Azure OpenAI Provisioned]>[コミットメント プランの管理] を選んで、プロビジョニング済みスループット購入ダイアログを表示します。
[コミットメントの購入] を選択します。
Azure OpenAI リソースを選び、コミットメントを購入します。 リソースは、編集できるコミットメントが既に存在するリソースと、現在コミットメントがないリソースに分けて表示されます。
設定 | メモ |
---|---|
リソースの選択 | プロビジョニングされたデプロイを作成するリソースを選びます。 コミットメントを購入すると、現在のコミットメントが期限切れになるまで、別のリソースで PTU を使用できなくなります。 |
コミットメント期間を選択します | [プロビジョニング済み] を選びます。 (プロビジョニング済みは、Provisioned Managed に相当します) |
現在コミットされていないプロビジョニング済みクォータ | このリソースにコミットするために現在使用できる PTU の数。 |
コミットする金額 (PTU) | コミットする PTU 数を選びます。 コミットメント期間中にこの数を増やすことができますが、減らすことはできません。 コミットメントタイプ "プロビジョニング済み" の場合、50 の増分で値を入力します。 |
現在の期間のコミットメント レベル | コミットメント期間は 1 か月に設定されます。 |
更新設定 | 現在の PTU での自動更新 下位の PTU での自動更新 自動更新しない |
- [購入] を選択します。 確認ダイアログが表示されます。 確認すると、PTU がコミットされ、それらを使ってプロビジョニングされたデプロイを作成できるようになります。 |
重要
新しいコミットメントは、期間全体に対して事前に課金されます。 更新の設定が自動更新に設定されている場合、更新日のたびに更新の設定に基づいて再度請求されます。
既存のプロビジョニング スループット コミットメントの編集
[コミットメントの管理] ビューから、既存のコミットメントを編集することもできます。 既存のコミットメントに対して行える変更には次の 2 つの種類があります。
- コミットメントに PTU を追加できます。
- 更新設定を変更できます。
コミットメントを編集するには、編集する現在のコミットメントを選択し、[コミットメントの編集] を選択します。
既存のコミットメントへのプロビジョニング スループット ユニットの追加
既存のコミットメントに PTU を追加すると、リソース内に多数のデプロイを作成できます。 コミットメントの期間中いつでもこれを行うことができます。
重要
コミットメントに PTU を追加すると、現在の日付から既存のコミットメント期間の終了日までの期間分に応じて即時請求されます。 PTU を追加しても、コミットメント期間はリセットされません。
更新設定の変更
コミットメントの更新設定は、コミットメントの有効期限前ならいつでも変更できます。 更新設定を変更する理由には、コミットメントを自動更新しないように設定してプロビジョニングされたスループットの使用を終了することや、次の期間にコミットされるPTU数を減らしてプロビジョニングされたスループットの使用量を減らすことなどがあります。
重要
コミットメントの期限切れやサイズの減少により、リソースのデプロイに必要なPTUがリソースのコミットメント以上になった場合、超過分のPTUについては毎時間、超過料金が発生します。 たとえば、デプロイの合計が 500 PTU でコミットメントが 300 PTUのリソースの場合、200 PTU に対して時間単位の超過料金が発生します。
コミットメントを監視し、予期しない課金を防ぐ
[ コミットメントの管理] セクションでは、特定の Azure サブスクリプション内のコミットメントと PTU 使用量を持つすべてのリソースのサブスクリプション全体の概要を示します。 特に重要なのは次のとおりです。
- PTU Committed、Deployed、Usage – これらの数値は、コミットメントのサイズと、デプロイで使用されている量を示します。 コミットされたすべての PTU を使用して、投資を最大化します。
- 有効期限ポリシーと日付 - 有効期限とポリシーは、コミットメントの期限が切れる時期と、その場合に発生することを示します。 自動更新するように設定されたコミットメントは、更新日に課金イベントを生成します。 期限切れのコミットメントの場合、期限切れ日より前にこれらのリソースからデプロイを削除して、時間単位の超過請求を防ぐ必要があります。コミットメントの現在の更新設定。
- 通知 - 未使用のコミットメントや、課金超過を招く可能性のある構成など、重要な条件に関するアラート。 請求超過は、コミットメントの期限が切れ、デプロイがまだ存在しているが、時間単位の課金に移行したなどの状況で発生する可能性があります。
重要
自動更新のコミットメントを設定した場合、 更新 日は翌月と同じ日になります。 日付が存在しない場合、更新日は月末になります。
例-
シナリオ 1: 2 月 21 日にコミットメントを購入し、 自動更新でコミットメントを設定した場合、コミットメントの次の更新日は 3 月 21 日になります。
シナリオ 2: 5 月 31 日にコミットメントを購入し、 自動更新のコミットメントを設定した場合、コミットメントの次回の更新日は 6 月 30 日 (月末) になります。6 月には 31 日はありません。
シナリオ 3: 1 月 31 日にコミットメントを購入し、 自動更新でコミットメントを設定した場合、コミットメントの次の更新日は 2 月 28 日 (月末) になります。これは、31 日または 30 日または 29 日 (閏年) がなく、更新日は 2 月の 2 月の 2 月 29 日 (閏年) になります。
コミットメント管理の一般的なシナリオ
プロビジョニング スループットの使用を終了する
現在のコミットメントの期限切れ後にプロビジョニングされたスループットの使用を終了し、期限切れ後の時間超過料金を防ぐには、次の 2 つのステップが必要です。
- すべてのコミットメントの更新ポリシーを [自動更新しない] に設定します。
- クォータを使って、プロビジョニングされたデプロイを削除します。
重要
プロビジョニングされたスループットを中止し、プロビジョニングされたデプロイを削除しない目的でコミットメントの有効期限が切れる場合、デプロイ中のすべての PTU に対して時間単位の超過料金が発生します。 たとえば、デプロイの合計が 500 PTU で、コミットメントが [自動再呼び出ししない ] に選択されているリソースでは、デプロイが削除されるまで、コミットメントの有効期限が切れた後に時間単位の料金が発生します。 現在、デプロイを自動的に削除するオプションはありません。プロビジョニングされたスループットの使用を中止する場合は、手動で削除する必要があります。
コミットメントまたはデプロイを同じサブスクリプションまたはリージョン内の新しいリソースに移動する
Azure AI Foundry では、デプロイやコミットメントを新しいリソースに直接 "移動" することはできません。 代わりに、ターゲット リソース上に新しいデプロイを作成し、トラフィックをそこに移動する必要があります。 これを実現するには、新しいリソースに対して購入したコミットメントが必要です。 コミットメントは、30 日間分、前払いで課金されるため、新しいコミットメントとの重複と、重複期間中の "二重課金" を最小限に抑えるために、この移行のタイミングを元のコミットメントの期限切れに合わせる必要があります。
この移行を実装するには 2 つのアプローチがあります。
オプション 1: オーバーラップなしの切り替え
このオプションの場合、ある程度のダウンタイムが必要ですが、追加のクォータは必要なく、追加のコストも発生しません。
手順 | メモ |
---|---|
既存のコミットメントの更新ポリシーを有効期限が切れるように設定します | こうすることで、コミットメントの更新とさらなる課金を防ぐことができます |
既存のコミットメントが期限切れになる前に、そのデプロイを削除します | ダウンタイムはこの時点から始まり、新しいデプロイが作成され、トラフィックが移動されるまで続きます。 有効期限の日時にできるだけ近いタイミングで削除することで、この期間を最小限に抑えることができます。 |
既存のコミットメントが期限切れになったら、新しいリソースにコミットメントを作成します | 有効期限が切れた後すぐにこの手順と以下の手順を実行して、ダウンタイムを最小限に抑えます。 |
新しいリソース上にデプロイを作成し、そこにトラフィックを移動します |
オプション 2: 重複する切り替え
このオプションでは、既存のデプロイと新しいデプロイの両方が同時に稼働するため、ダウンタイムは発生しません。 これには、新しいデプロイを作成するために使用できるクォータが必要であり、重複するデプロイの期間中に追加のコストが発生します。
手順 | メモ |
---|---|
既存のコミットメントの更新ポリシーを有効期限が切れるように設定します | こうすることで、コミットメントの更新とさらなる課金を防ぐことができます。 |
既存のコミットメントの有効期限が切れる前: 1.新しいリソースにコミットメントを作成します。 2.新しいデプロイを作成します。 3.トラフィックを切り替えます 4.既存のデプロイを削除します |
既存のコミットメントが期限切れになる前にすべての手順を完了できる十分な時間を確保してください。そうしないと、オプションに対して超過料金が発生します (次のセクションを参照してください)。 |
最後の手順に予想より時間がかかり、既存のコミットメントの期限が切れた後に完了する場合、超過料金を最小限に抑えるには 3 つのオプションがあります。
- ダウンタイムを取る: 元のデプロイを削除して、移動を完了します。
- 超過料金を支払う: トラフィックを移動してデプロイを削除するまで、元のデプロイを維持し、時間単位で支払います。
- 元のコミットメントをリセットして、もう一度更新します。 こうすることで、既知のコストで移動を完了する時間が得られます。
元の有効期限を過ぎると、超過料金の支払いと元のコミットメントのリセットの両方で料金が発生します。 移動にかかる期間が 1 日から 2 日で済む場合は、超過料金を支払う方が、新しい 1 か月分のコミットメントよりも安くなる可能性があります。 両方のオプションのコストを比較して、最も低コストのアプローチを見つけてください。
デプロイを新しいリージョンまたはサブスクリプションに移動する
リージョン内でコミットメントとデプロイを移動する場合にも同じアプローチが適用されますが、あらゆる場合に新しい場所で使用できるクォータが必要になる点が異なります。
既存のリソースの表示と編集
Azure AI Foundry で、[管理センター]>[クォータ]>[プロビジョニング済み]>[コミットメントの管理] を選び、既存のコミットメントがあるリソースを選んで表示または変更します。