Azure OpenAI 監視データのリファレンス

2025-05-25

この記事には、このサービスに関するすべての監視リファレンス情報が含まれています。

Azure AI Foundry モデルで Azure OpenAI 用に収集できるデータとその使用方法の詳細については、Azure OpenAI の監視に関するページを参照してください。

メトリック

このセクションには、このサービスに関して自動的に収集されるすべてのプラットフォームメトリックが一覧表示されています。これらのメトリックは、Azure Monitor でサポートされているすべてのプラットフォームメトリックのグローバルリストにも含まれています。

メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。

Microsoft.CognitiveServices/accounts でサポートされているメトリック

Azure OpenAI を監視する必要があると考える最も重要なメトリックを次に示します。この記事の後半では、この短いリストのメトリックの詳細を含む、この名前空間で使用可能なすべてのメトリックの長い一覧を示します。 最新の情報については、以下の一覧を参照してください。次のセクションでは、テーブルの更新に取り組んでいます。

Azure OpenAI 要求
アクティブトークン
生成された完了トークン数
Processed FineTuned Training Hours (FineTuned 処理済みトレーニング時間)
Processed Ada Inference Tokens (処理済み推論トークン)
処理されたプロンプトトークン数
プロビジョニングされたマネージド使用率 V2
プロンプトトークンキャッシュの一致率
Time to Response
トークン間の時間
最後のバイトまでの時間
正規化された時刻から最初のバイト
1 秒あたりのトークン数

また、他の関連サービスで使用されているコンテンツの安全性メトリックを監視することもできます。

ブロックされたボリューム
有害なボリュームが検出されました
潜在的な不正なユーザー数
安全システムイベント
安全性チェックのために送信された合計ボリューム

注

プロビジョニングされたマネージド使用率メトリックは非推奨になり、推奨されなくなりました。このメトリックは、プロビジョニングされたマネージド使用率 V2 メトリックに置き替えられました。現時点では、1 秒あたりのトークン数、Time to Response、Time Between Tokens は、Standard デプロイでは使用できません。

Cognitive Services メトリックには、次の表 Cognitive Services - HTTP 要求 カテゴリがあります。これらのメトリックは、この種類のすべてのリソースに共通するレガシメトリックです。 Microsoft では、これらのメトリックを Azure OpenAI で使用することは推奨されなくなりました。

次の表に、Microsoft.CognitiveServices/accounts リソースの種類で使用できるメトリックの一覧を示します。

すべての列がすべてのテーブルに存在しないことがあります。
一部の列がページの表示領域を超えている場合があります。 [テーブルの展開] を選択すると、使用可能なすべての列が表示されます。

テーブルの見出し

カテゴリ - メトリックグループまたは分類。
メトリック - Azure Portal に表示されるメトリックの表示名。
REST API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の集計の種類。有効な値: 平均 (Avg)、最小 (Min)、最大 (Max)、合計 (Sum)、数。
ディメンション - メトリックで使用できるディメンション。
時間グレイン - メトリックをサンプリングする間隔。たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。メトリックのエクスポートについては、「Azure Monitor で診断設定を作成する」を参照してください。

カテゴリ: アクション

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
アクションの発生各アクションが出現する回数。	`ActionIdOccurrences`	カウント	合計 (和)	`ActionId`、 `Mode`、 `RunId`	PT1M	はい
イベントあたりのアクション数イベントあたりのアクション数。	`ActionsPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい

カテゴリ: Azure OpenAI - HTTP 要求

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
Azure OpenAI AvailabilityRate 次の計算による可用性の割合: (呼び出しの合計数 - サーバーエラー)/呼び出しの合計数。サーバーエラーには、HTTP 応答 >=500 が含まれます。	`AzureOpenAIAvailabilityRate`	パーセント	Minimum、Maximum、Average	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
Azure OpenAI 要求一定期間に Azure OpenAI API に対して行われた呼び出しの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StatusCode (成功、クライアントエラー、サーバーエラー)、StreamType (ストリーミング要求と非ストリーミング要求)、および操作のディメンションで分割を適用できます。	`AzureOpenAIRequests`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	はい

カテゴリ: Azure OpenAI - 待機時間

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
トークン間の時間ストリーミング要求の場合。モデルトークン生成率 (ミリ秒単位)。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`AzureOpenAINormalizedTBTInMS`	ミリ秒	最大、最小、平均	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
正規化された時刻から最初のバイトストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`AzureOpenAINormalizedTTFTInMS`	ミリ秒	最大、最小、平均	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。この数字は、プロンプトサイズが増えたりキャッシュヒットサイズが減ったりすると、大きくなります。応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロードパターンなど、複数の要因に大きく依存するため、近似値です。さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。最適な待機時間の追跡については、お客様のログ記録を参照してください。	`AzureOpenAITimeToResponse`	ミリ秒	Minimum、Maximum、Average	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	はい
1 秒あたりのトークン数特定の Azure OpenAI モデル応答の生成速度を列挙します。生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`AzureOpenAITokenPerSecond`	カウント	最大、最小、平均	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
最後のバイトまでの時間ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`AzureOpenAITTLTInMS`	ミリ秒	最大、最小、平均	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい

カテゴリ: Azure OpenAI - 使用状況

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
アクティブトークントークンの合計から一定期間にキャッシュされたトークンを差し引いた値。 PTU と PTU で管理されるデプロイに適用されます。このメトリックを使用して、PTU の TPS または TPM ベースの使用率を把握し、シナリオのターゲット TPS または TPM のベンチマークと比較します。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、および ModelVersion というディメンションで分割を適用できます。	`ActiveTokens`	カウント	Minimum、Maximum、Average、Total (Sum)	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
オーディオ補完トークン OpenAI モデルで生成 (出力) されたオーディオプロンプトトークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。	`AudioCompletionTokens`	カウント	合計 (和)	`ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `Region`	PT1M	はい
オーディオプロンプトトークン OpenAI モデルで処理 (入力) されたオーディオプロンプトトークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。	`AudioPromptTokens`	カウント	合計 (和)	`ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `Region`	PT1M	はい
プロンプトトークンキャッシュの一致率キャッシュにヒットしたプロンプトトークンの割合。 PTU と PTU で管理されるデプロイに適用されます。	`AzureOpenAIContextTokensCacheMatchRate`	パーセント	Minimum、Maximum、Average	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
プロビジョニングされたマネージド使用率 (非推奨) (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージドデプロイの使用率 %。使用率が 100% 以上の場合、呼び出しは調整され、エラーコード 429 が返されます。このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。	`AzureOpenAIProvisionedManagedUtilization`	パーセント	Minimum、Maximum、Average	`Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
プロビジョニングされたマネージド使用率 V2 (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージドデプロイの使用率 %。使用率が 100% 以上の場合、呼び出しは調整され、エラーコード 429 が返されます。このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。	`AzureOpenAIProvisionedManagedUtilizationV2`	パーセント	Minimum、Maximum、Average	`Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
処理済み FineTuned トレーニング時間 FineTuned モデルで処理されたトレーニング時間数	`FineTunedTrainingHours`	カウント	合計 (和)	`ApiName`、 `ModelDeploymentName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
生成された完了トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。	`GeneratedTokens`	カウント	合計 (和)	`ApiName`、 `ModelDeploymentName`、 `FeatureName`、 `UsageChannel`、 `Region`、 `ModelVersion`	PT1M	はい
処理されたプロンプトトークン OpenAI モデルで処理 (入力) されたプロンプトトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。	`ProcessedPromptTokens`	カウント	合計 (和)	`ApiName`、 `ModelDeploymentName`、 `FeatureName`、 `UsageChannel`、 `Region`、 `ModelVersion`	PT1M	はい
処理された推論トークン OpenAI モデルで処理された推論トークンの数。プロンプトトークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。	`TokenTransaction`	カウント	合計 (和)	`ApiName`、 `ModelDeploymentName`、 `FeatureName`、 `UsageChannel`、 `Region`、 `ModelVersion`	PT1M	はい

カテゴリ: Cognitive Services - HTTP 要求

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
ブロックされた呼び出しレートまたはクォータの制限を超えた呼び出しの回数。 Azure OpenAI サービスには使用しないでください。	`BlockedCalls`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
クライアントエラークライアント側のエラー (HTTP 応答コード 4xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。	`ClientErrors`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
受信データ受信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。	`DataIn`	バイト	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい
送信データ送信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。	`DataOut`	バイト	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい
待機時間待機時間 (ミリ秒)。 Azure OpenAI サービスには使用しないでください。	`Latency`	ミリ秒	平均	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
Ratelimit ratelimit キーの現在の ratelimit。 Azure OpenAI サービスには使用しないでください。	`Ratelimit`	カウント	合計 (和)	`Region`、`RatelimitKey`	PT1M	はい
サーバーエラーサービスの内部エラー (HTTP 応答コード 5xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。	`ServerErrors`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
成功した呼び出し成功した呼び出しの数。 Azure OpenAI サービスには使用しないでください。	`SuccessfulCalls`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
合計通話数コールの合計数。 Azure OpenAI サービスには使用しないでください。	`TotalCalls`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
合計エラー数エラー応答 (HTTP 応答コード 4xx または 5xx) があった呼び出しの合計回数。 Azure OpenAI サービスには使用しないでください。	`TotalErrors`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	はい
トークン呼び出しの合計数トークン呼び出しの合計回数。	`TotalTokenCalls`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい

カテゴリ: Cognitive Services - SLI

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
AvailabilityRate 次の計算による可用性の割合: (呼び出しの合計数 - サーバーエラー)/呼び出しの合計数。サーバーエラーには、HTTP 応答 >=500 が含まれます。 Azure OpenAI サービスには使用しないでください。	`SuccessRate`	パーセント	Minimum、Maximum、Average	`ApiName`、 `OperationName`、 `Region`、 `RatelimitKey`	PT1M	いいえ

カテゴリ: ContentSafety - リスクと安全性

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
悪用される可能性のあるユーザー数一定期間に検出された、悪用される可能性のあるユーザーの数。フィルターを追加するか、次のディメンションで分割を適用できます: ModelDeploymentName。	`RAIAbusiveUsersCount`	カウント	合計 (和)	`Region`、`ModelDeploymentName`	PT1M	はい
有害なボリュームが検出されました Azure OpenAI API に対して行われ、一定期間にわたって適用されたコンテンツフィルターによって有害 (ブロックモデルと注釈モードの両方) として検出された呼び出しの数。フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。	`RAIHarmfulRequests`	カウント	合計 (和)	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `ApiName`、 `TextType`、 `Category`、 `Severity`	PT1M	はい
ブロックされたボリューム Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツフィルターによって拒否された呼び出しの数。フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。	`RAIRejectedRequests`	カウント	合計 (和)	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `ApiName`、 `TextType`、 `Category`	PT1M	はい
安全システムイベントリスクと安全性の監視のためのシステムイベント。フィルターを追加するか、次のディメンションで分割を適用できます: EventType。	`RAISystemEvent`	カウント	平均	`Region`、`EventType`	PT1M	はい
安全性チェックのために送信された合計ボリューム Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツフィルターによって検出された呼び出しの数。フィルターを追加したり、ModelDeploymentName、ModelName というディメンションで分割を適用したりできます。	`RAITotalRequests`	カウント	合計 (和)	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `ApiName`	PT1M	はい

カテゴリ: ContentSafety - Usage

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
イメージモデレーションの呼び出し数イメージモデレーションの呼び出しの数。	`ContentSafetyImageAnalyzeRequestCount`	カウント	合計 (和)	`ApiVersion`	PT1M	はい
テキストモデレーションの呼び出し数テキストモデレーションの呼び出しの数。	`ContentSafetyTextAnalyzeRequestCount`	カウント	合計 (和)	`ApiVersion`	PT1M	はい

カテゴリ: 見積もり

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
ベースラインランダムイベント数ベースラインランダムイベント数の推定。	`BaselineRandomEventCount`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
ベースラインランダム報酬ベースラインランダム報酬の推定。	`BaselineRandomReward`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
オンラインイベント数オンラインイベント数の推定。	`OnlineEventCount`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
オンラインリワードオンライン報酬の推定。	`OnlineReward`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
ユーザーベースラインイベント数ユーザー定義のベースラインイベント数の推定。	`UserBaselineEventCount`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
ユーザーベースライン報酬ユーザー定義のベースライン報酬の推定。	`UserBaselineReward`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい

カテゴリ: 特徴の発生

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
アクション機能の出現回数各アクション特徴が出現する回数。	`ActionFeatureIdOccurrences`	カウント	合計 (和)	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい
コンテキスト機能の出現各コンテキスト特徴が出現する回数。	`ContextFeatureIdOccurrences`	カウント	合計 (和)	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい
スロットフィーチャーの出現回数各スロット特徴が出現する回数。	`SlotFeatureIdOccurrences`	カウント	合計 (和)	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい

カテゴリ: FeatureCardinality

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
アクション別の特徴カーディナリティアクションに基づく特徴カーディナリティ。	`FeatureCardinality_Action`	カウント	平均	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい
コンテキスト別の特徴カーディナリティコンテキストに基づく特徴カーディナリティ。	`FeatureCardinality_Context`	カウント	平均	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい
スロットごとの特徴カーディナリティスロットに基づく特徴カーディナリティ。	`FeatureCardinality_Slot`	カウント	平均	`FeatureId`、 `Mode`、 `RunId`	PT1M	はい

カテゴリ: イベントごとの機能

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
イベントごとのアクション機能イベントあたりのアクション特徴の平均数。	`ActionFeaturesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい
イベントごとのコンテキスト機能イベントあたりのコンテキスト特徴の数。	`ContextFeaturesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい
イベントごとのスロット機能イベントあたりのスロット特徴の平均数。	`SlotFeaturesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい

カテゴリ: 言語 - ジョブ

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
ジョブの期間 (プレビュー) 注: この値は、入力サイズ、ドキュメント数、タスクの複雑さに大きく依存します。これは、すべてのジョブタスクの集計値です。	`JobDuration`	ミリ秒	Minimum、Maximum、Average	`JobStatus`、`JobType`	PT1M	はい

カテゴリ: モデル - HTTP 要求

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
モデルの可用性率次の計算による可用性の割合: (呼び出しの合計数 - サーバーエラー)/呼び出しの合計数。サーバーエラーには、HTTP 応答 >=500 が含まれます。	`ModelAvailabilityRate`	パーセント	Minimum、Maximum、Average	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
モデル要求一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`ModelRequests`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	はい

カテゴリ: モデル - 待機時間

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
トークン間の時間ストリーミング要求の場合。モデルトークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。	`NormalizedTimeBetweenTokens`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
正規化された時刻から最初のバイトストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`NormalizedTimeToFirstToken`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
最後のバイトまでの時間ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`TimeToLastByte`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。この数字は、プロンプトサイズが増えたりキャッシュヒットサイズが減ったりすると、大きくなります。応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロードパターンなど、複数の要因に大きく依存するため、近似値です。さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。最適な待機時間の追跡については、お客様のログ記録を参照してください。	`TimeToResponse`	ミリ秒	Minimum、Maximum、Average	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	はい
1 秒あたりのトークン数特定のモデル応答の生成速度を列挙します。生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。	`TokensPerSecond`	カウント	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい

カテゴリ: モデル - 使用法

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
入力トークンモデルで処理 (入力) されたプロンプトトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`InputTokens`	カウント	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
出力トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`OutputTokens`	カウント	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい
プロビジョニングされた使用率 (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージドデプロイの使用率 %。使用率が 100% 以上の場合、呼び出しは調整され、エラーコード 429 が返されます。	`ProvisionedUtilization`	パーセント	Minimum、Maximum、Average	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
合計トークン数モデルで処理された推論トークンの数。プロンプトトークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。	`TotalTokens`	カウント	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	はい

カテゴリ: イベントごとの名前空間

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
イベントごとのアクション名前空間イベントあたりのアクション名前空間の平均数。	`ActionNamespacesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい
イベントごとのコンテキスト名前空間イベントあたりのコンテキスト名前空間の数。	`ContextNamespacesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい
イベントごとのスロット名前空間イベントあたりのスロット名前空間の平均数。	`SlotNamespacesPerEvent`	カウント	平均	`Mode`、`RunId`	PT1M	はい

カテゴリ: リワード

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
イベントあたりの平均報酬イベントあたりの平均報酬。	`Reward`	カウント	平均	`BaselineAction`、 `ChosenActionId`、 `MatchesBaseline`、 `NonDefaultReward`、 `Mode`、 `RunId`	PT1M	はい
スロットリワードスロットあたりの報酬。	`SlotReward`	カウント	平均	`BaselineActionId`、 `ChosenActionId`、 `MatchesBaseline`、 `NonDefaultReward`、 `SlotId`、 `SlotIndex`、 `Mode`、 `RunId`	PT1M	はい

カテゴリ: スロット

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
ベースライン推定器の全体的な報酬 Baseline Estimator Overall Reward (ベースライン推定器の全体的な報酬)。	`BaselineEstimatorOverallReward`	カウント	平均	`Mode`、`RunId`	PT1M	はい
ベースライン推定スロット報酬スロット別のベースライン推定器報酬。	`BaselineEstimatorSlotReward`	カウント	平均	`SlotId`、 `SlotIndex`、 `Mode`、 `RunId`	PT1M	はい
ベースラインランダム推定器の全体的な報酬 Baseline Random Estimator Overall Reward (ベースラインランダム推定器の全体的な報酬)。	`BaselineRandomEstimatorOverallReward`	カウント	平均	`Mode`、`RunId`	PT1M	はい
ベースラインランダムエスティメータースロット報酬スロット別のベースラインランダム推定器報酬。	`BaselineRandomEstimatorSlotReward`	カウント	平均	`SlotId`、 `SlotIndex`、 `Mode`、 `RunId`	PT1M	はい
スロットイベントあたりのスロットの数。	`NumberOfSlots`	カウント	平均	`Mode`、`RunId`	PT1M	はい
オンライン推定器の全体的な報酬 Online Estimator Overall Reward (オンライン推定器の全体的な報酬)。	`OnlineEstimatorOverallReward`	カウント	平均	`Mode`、`RunId`	PT1M	はい
オンライン推定スロット報酬スロット別のオンライン推定器報酬。	`OnlineEstimatorSlotReward`	カウント	平均	`SlotId`、 `SlotIndex`、 `Mode`、 `RunId`	PT1M	はい
スロットの出現回数各スロットが出現する回数。	`SlotIdOccurrences`	カウント	合計 (和)	`SlotId`、 `SlotIndex`、 `Mode`、 `RunId`	PT1M	はい

カテゴリ: SpeechServices - Usage

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
書き起こされたオーディオの秒数書き起こしの秒数	`AudioSecondsTranscribed`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
翻訳されたオーディオの秒数翻訳の秒数	`AudioSecondsTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
アバターモデルホスティング秒数秒数。	`AvatarModelHostingSeconds`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
アバターモデルトレーニング秒数秒数。	`AvatarModelTrainingSeconds`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
話者プロファイルの数登録されたスピーカープロファイルの数。一時間ごとに日分けされます。	`NumberofSpeakerProfiles`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
話者認識トランザクション Speaker Recognition トランザクションの数	`SpeakerRecognitionTransactions`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
Speech モデルのホスティング時間音声モデルホスティングの時間数	`SpeechModelHostingHours`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
合成された文字数文字数。	`SynthesizedCharacters`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
合成されたビデオの秒数合成された秒数	`VideoSecondsSynthesized`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
音声モデルホスティング時間時間数。	`VoiceModelHostingHours`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
音声モデルトレーニング分数分数。	`VoiceModelTrainingMinutes`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい

カテゴリ: 使用

メトリック	REST API での名前	出荷単位	集計	次元	期間粒度	DS エクスポート
推論の数 Carnegie Frontdoor Service の推論数	`CarnegieInferenceCount`	カウント	合計 (和)	`Region`、 `Modality`、 `Category`、 `Language`、 `SeverityLevel`、 `UseCustomList`	PT1M	はい
トレーニング済み文字 (非推奨) トレーニングされた文字の合計数。	`CharactersTrained`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい
翻訳された文字 (非推奨) 受信テキスト要求の合計文字数。	`CharactersTranslated`	カウント	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい
Computer Vision トランザクション Computer Vision のトランザクションの数	`ComputerVisionTransactions`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
Custom Vision トレーニング時間 Custom Vision のトレーニング時間	`CustomVisionTrainingTime`	秒	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
Custom Vision トランザクション Custom Vision 予測トランザクションの数	`CustomVisionTransactions`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
翻訳されたドキュメント文字ドキュメント翻訳要求の文字数。	`DocumentCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
翻訳されたカスタム文字をドキュメント化するカスタムドキュメント翻訳要求の文字数。	`DocumentCustomCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
トレーニング済みの顔画像トレーニングされたイメージの数。トランザクションごとにトレーニングされた 1,000 件のイメージ。	`FaceImagesTrained`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
保存されている顔 1 日に日分けして格納された顔の数。格納されている顔の数は毎日報告されます。	`FacesStored`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
Face Transactions Face サービスに対して行われた API 呼び出しの数	`FaceTransactions`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
保存されたイメージ格納されている Custom Vision イメージの数。	`ImagesStored`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
学習済みイベント学習したイベントの数。	`LearnedEvents`	カウント	合計 (和)	`IsMatchBaseline`、 `Mode`、 `RunId`	PT1M	はい
LUIS 音声リクエスト意図を理解する要求に対する LUIS 音声の数	`LUISSpeechRequests`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
LUIS テキスト要求 LUIS テキスト要求の数	`LUISTextRequests`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
一致したリワード一致した報酬の数。	`MatchedRewards`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
非アクティブ化イベントスキップしたイベントの数。	`NonActivatedEvents`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
観察された報酬観察された報酬の数。	`ObservedRewards`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
翻訳されたドキュメント同期文字ドキュメント変換 (同期) 要求の文字数。	`OneDocumentCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
翻訳されたドキュメント同期のカスタム文字カスタムドキュメント翻訳 (同期) 要求の文字数。	`OneDocumentCustomCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
処理された文字 Immersive Reader によって処理された文字数。	`ProcessedCharacters`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
処理された正常性テキストレコード処理された正常性テキストレコードの数	`ProcessedHealthTextRecords`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
処理されたイメージ処理されたイメージの数	`ProcessedImages`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
処理済みページ処理されたページの数	`ProcessedPages`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
処理されたテキストレコードテキストレコードの数。	`ProcessedTextRecords`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
QA テキストレコード処理されたテキストレコードの数	`QuestionAnsweringTextRecords`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
Speech Session Duration (非推奨) 音声セッションの合計継続時間 (秒)。	`SpeechSessionDuration`	秒	合計 (和)	`ApiName`、 `OperationName`、 `Region`	PT1M	はい
翻訳されたテキスト文字受信テキスト翻訳要求の文字数。	`TextCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
翻訳されたテキストカスタム文字受信カスタムテキスト翻訳要求の文字数。	`TextCustomCharactersTranslated`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
テキストトレーニング済み文字テキスト翻訳を使用してトレーニングされた文字数。	`TextTrainedCharacters`	カウント	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい
合計イベント数イベント数。	`TotalEvents`	カウント	合計 (和)	`Mode`、`RunId`	PT1M	はい
合計トランザクション数 (非推奨) トランザクションの合計数。	`TotalTransactions`	カウント	合計 (和)	<なし>	PT1M	はい
Translator Pro アプリの秒数 Translator Pro アプリの使用秒数。	`TranslatorProAppSeconds`	秒	合計 (和)	`ApiName`、 `FeatureName`、 `UsageChannel`、 `Region`	PT1M	はい

メトリックディメンション

メトリックディメンションについては、「多次元メトリック」を参照してください。

このサービスでは、次のディメンションがそのメトリックに関連付けられています。

ApiName
機能名
ModelDeploymentName
モデル名
モデルバージョン
オペレーションネーム
リージョン
ステータスコード
ストリームタイプ
UsageChannel

リソースログ

このセクションでは、このサービス用に収集できるリソースログの種類を一覧表示します。このセクションでは、Azure Monitor でサポートされているすべてのリソースログカテゴリの種類のリストからプルされます。

Microsoft.CognitiveServices/accounts でサポートされているリソースログ

カテゴリ	カテゴリの表示名	ログテーブル	基本ログプランをサポート	インジェスト時間変換をサポート	エクスポートするコスト
`Audit`	監査ログ	AzureDiagnostics 複数の Azure リソースからのログ。	いいえ	いいえ	いいえ
`AzureOpenAIRequestUsage`	Azure OpenAI 要求の使用状況	AzureDiagnostics 複数の Azure リソースからのログ。	いいえ	いいえ	はい
`RequestResponse`	要求と応答のログ	AzureDiagnostics 複数の Azure リソースからのログ。	いいえ	いいえ	いいえ
`Trace`	トレースログ	AzureDiagnostics 複数の Azure リソースからのログ。	いいえ	いいえ	いいえ

Azure Monitor ログテーブル

このセクションでは、Kusto クエリを使用した Log Analytics によるクエリに使用できる、このサービスに関連するすべての Azure Monitor ログテーブルを一覧表示します。テーブルにはリソースログデータが含まれており、収集されルーティングされる内容によっては、さらに多くのデータが含まれる場合があります。

Azure OpenAI microsoft.cognitiveservices/accounts

アクティビティログ

リンクされたテーブルには、このサービスのアクティビティログに記録できる操作が一覧表示されます。これらの操作は、アクティビティログで使用可能なすべてのリソースプロバイダー操作のサブセットです。

アクティビティログエントリのスキーマの詳細については、「アクティビティログのスキーマ」を参照してください。

AI + 機械学習リソースプロバイダーの操作

Azure OpenAI の監視の詳細については、 Monitor Azure OpenAI を参照してください。
Azure リソースの監視の詳細については、「Azure Monitor で Azure リソースを監視する」を参照してください。