次の方法で共有


Azure OpenAI 監視データのリファレンス

この記事には、このサービスに関するすべての監視リファレンス情報が含まれています。

Azure AI Foundry モデルで Azure OpenAI 用に収集できるデータとその使用方法の詳細については、Azure OpenAI の監視に関するページを参照してください。

メトリック

このセクションには、このサービスに関して自動的に収集されるすべてのプラットフォーム メトリックが一覧表示されています。 これらのメトリックは、Azure Monitor でサポートされているすべてのプラットフォーム メトリックのグローバル リストにも含まれています。

メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。

Microsoft.CognitiveServices/accounts でサポートされているメトリック

Azure OpenAI を監視する必要があると考える最も重要なメトリックを次に示します。 この記事の後半では、この短いリストのメトリックの詳細を含む、この名前空間で使用可能なすべてのメトリックの長い一覧を示します。 最新の情報については、以下の一覧を参照してください。 次のセクションでは、テーブルの更新に取り組んでいます。

  • Azure OpenAI 要求
  • アクティブ トークン
  • 生成された完了トークン数
  • Processed FineTuned Training Hours (FineTuned 処理済みトレーニング時間)
  • Processed Ada Inference Tokens (処理済み推論トークン)
  • 処理されたプロンプト トークン数
  • プロビジョニングされたマネージド使用率 V2
  • プロンプト トークン キャッシュの一致率
  • Time to Response
  • トークン間の時間
  • 最後のバイトまでの時間
  • 正規化された時刻から最初のバイト
  • 1 秒あたりのトークン数

また、他の関連サービスで使用されているコンテンツの安全性メトリックを監視することもできます。

  • ブロックされたボリューム
  • 有害なボリュームが検出されました
  • 潜在的な不正なユーザー数
  • 安全システムイベント
  • 安全性チェックのために送信された合計ボリューム

プロビジョニングされたマネージド使用率メトリックは非推奨になり、推奨されなくなりました。 このメトリックは、プロビジョニングされたマネージド使用率 V2 メトリックに置き替えられました。 現時点では、1 秒あたりのトークン数、Time to Response、Time Between Tokens は、Standard デプロイでは使用できません。

Cognitive Services メトリックには、次の表 Cognitive Services - HTTP 要求 カテゴリがあります。 これらのメトリックは、この種類のすべてのリソースに共通するレガシ メトリックです。 Microsoft では、これらのメトリックを Azure OpenAI で使用することは推奨されなくなりました。

次の表に、Microsoft.CognitiveServices/accounts リソースの種類で使用できるメトリックの一覧を示します。

  • すべての列がすべてのテーブルに存在しないことがあります。
  • 一部の列がページの表示領域を超えている場合があります。 [テーブルの展開] を選択すると、使用可能なすべての列が表示されます。

テーブルの見出し

  • カテゴリ - メトリック グループまたは分類。
  • メトリック - Azure Portal に表示されるメトリックの表示名。
  • REST API の名前 - REST API で参照されるメトリック名。
  • 単位 - 測定単位。
  • 集計 - 既定の集計の種類。 有効な値: 平均 (Avg)、最小 (Min)、最大 (Max)、合計 (Sum)、数。
  • ディメンション - メトリックで使用できるディメンション
  • 時間グレイン - メトリックをサンプリングする間隔。 たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
  • DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。 メトリックのエクスポートについては、「Azure Monitor で診断設定を作成する」を参照してください。

カテゴリ: アクション

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
アクションの発生事例

各アクションが出現する回数。
ActionIdOccurrences 数える 合計 (和) ActionIdModeRunId PT1M イエス
イベントあたりのアクション数

イベントあたりのアクション数。
ActionsPerEvent 数える 平均 ModeRunId PT1M イエス

カテゴリ: Azure OpenAI - HTTP 要求

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
Azure OpenAI AvailabilityRate

次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。
AzureOpenAIAvailabilityRate パーセント 最小値、最大値、平均値 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M いいえ
Azure OpenAI 要求

一定期間に Azure OpenAI API に対して行われた呼び出しの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StatusCode (成功、クライアント エラー、サーバー エラー)、StreamType (ストリーミング要求と非ストリーミング要求)、および操作のディメンションで分割を適用できます。
AzureOpenAIRequests 数える 合計 (和) ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス

カテゴリ: Azure OpenAI - 待機時間

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
トークン間の時間

ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
AzureOpenAINormalizedTBTInMS ミリ秒 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M イエス
正規化された最初のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
AzureOpenAINormalizedTTFTInMS ミリ秒 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M イエス
Time to Response

ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。

注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。
AzureOpenAITimeToResponse ミリ秒 最小値、最大値、平均値 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス
1 秒あたりのトークン数

特定の Azure OpenAI モデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
AzureOpenAITokenPerSecond 数える 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M イエス
最後のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
AzureOpenAITTLTInMS ミリ秒 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M イエス

カテゴリ: Azure OpenAI - 使用状況

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
アクティブ トークン

トークンの合計から一定期間にキャッシュされたトークンを差し引いた値。 PTU と PTU で管理されるデプロイに適用されます。 このメトリックを使用して、PTU の TPS または TPM ベースの使用率を把握し、シナリオのターゲット TPS または TPM のベンチマークと比較します。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、および ModelVersion というディメンションで分割を適用できます。
ActiveTokens 数える Minimum、Maximum、Average、Total (Sum) RegionModelDeploymentNameModelNameModelVersion PT1M イエス
オーディオ補完トークン

OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。
AudioCompletionTokens 数える 合計 (和) ModelDeploymentNameModelNameModelVersionRegion PT1M イエス
オーディオ プロンプト トークン

OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。
AudioPromptTokens 数える 合計 (和) ModelDeploymentNameModelNameModelVersionRegion PT1M イエス
プロンプト トークン キャッシュの一致率

キャッシュにヒットしたプロンプト トークンの割合。 PTU と PTU で管理されるデプロイに適用されます。
AzureOpenAIContextTokensCacheMatchRate パーセント 最小値、最大値、平均値 RegionModelDeploymentNameModelNameModelVersion PT1M いいえ
プロビジョニング済みマネージド使用率 (非推奨)

プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。
AzureOpenAIProvisionedManagedUtilization パーセント 最小値、最大値、平均値 RegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M いいえ
プロビジョニング済みマネージド使用率 V2

プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。
AzureOpenAIProvisionedManagedUtilizationV2 パーセント 最小値、最大値、平均値 RegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M いいえ
処理済み 微調整されたトレーニング時間

微調整されたOpenAIモデルで処理されたトレーニング時間の総数
FineTunedTrainingHours 数える 合計 (和) ApiNameModelDeploymentNameFeatureNameUsageChannelRegion PT1M イエス
生成された完了トークン

OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
GeneratedTokens 数える 合計 (和) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M イエス
処理されたプロンプト トークン

OpenAI モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
ProcessedPromptTokens 数える 合計 (和) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M イエス
処理された推論トークン

OpenAI モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
TokenTransaction 数える 合計 (和) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M イエス

カテゴリ: コグニティブ サービス - HTTP 要求

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
ブロックされた呼び出し

レートまたはクォータの制限を超えた呼び出しの回数。 Azure OpenAI サービスには使用しないでください。
BlockedCalls 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
クライアント エラー

クライアント側のエラー (HTTP 応答コード 4xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。
ClientErrors 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
データイン

受信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。
DataIn バイト(データ単位) 合計 (和) ApiNameOperationNameRegion PT1M イエス
データ出力

送信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。
DataOut バイト(データ単位) 合計 (和) ApiNameOperationNameRegion PT1M イエス
遅延

待機時間 (ミリ秒)。 Azure OpenAI サービスには使用しないでください。
Latency ミリ秒 平均 ApiNameOperationNameRegionRatelimitKey PT1M イエス
Ratelimit

ratelimitキーの現在のレート制限。 Azure OpenAI サービスには使用しないでください。
Ratelimit 数える 合計 (和) RegionRatelimitKey PT1M イエス
サーバー エラー

サービスの内部エラー (HTTP 応答コード 5xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。
ServerErrors 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
成功した呼び出し

成功した呼び出しの数。 Azure OpenAI サービスには使用しないでください。
SuccessfulCalls 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
合計通話数

呼び出しの合計数。 Azure OpenAI サービスには使用しないでください。
TotalCalls 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
合計エラー数

エラー応答 (HTTP 応答コード 4xx または 5xx) があった呼び出しの合計回数。 Azure OpenAI サービスには使用しないでください。
TotalErrors 数える 合計 (和) ApiNameOperationNameRegionRatelimitKey PT1M イエス
トークン呼び出しの合計数

トークン呼び出しの合計回数。
TotalTokenCalls 数える 合計 (和) ApiNameOperationNameRegion PT1M イエス

カテゴリ: Cognitive Services - SLI

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
AvailabilityRate

次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 Azure OpenAI サービスには使用しないでください。
SuccessRate パーセント 最小値、最大値、平均値 ApiNameOperationNameRegionRatelimitKey PT1M いいえ

カテゴリ: ContentSafety - リスクと安全性

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
悪用される可能性のあるユーザー数

一定期間に検出された、悪用される可能性のあるユーザーの数。 フィルターを追加するか、次のディメンションで分割を適用できます: ModelDeploymentName。
RAIAbusiveUsersCount 数える 合計 (和) RegionModelDeploymentName PT1M イエス
有害なボリュームが検出されました

Azure OpenAI API に対して行われ、一定期間にわたって適用されたコンテンツ フィルターによって有害 (ブロック モデルと注釈モードの両方) として検出された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。
RAIHarmfulRequests 数える 合計 (和) RegionModelDeploymentNameModelNameModelVersionApiNameTextTypeCategorySeverity PT1M イエス
ブロックされたボリューム

Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツ フィルターによって拒否された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。
RAIRejectedRequests 数える 合計 (和) RegionModelDeploymentNameModelNameModelVersionApiNameTextTypeCategory PT1M イエス
安全システムイベント

リスクと安全性の監視のためのシステム イベント。 フィルターを追加するか、次のディメンションで分割を適用できます: EventType。
RAISystemEvent 数える 平均 RegionEventType PT1M イエス
安全性チェックのために送信された合計ボリューム

Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツ フィルターによって検出された呼び出しの数。 フィルターを追加したり、ModelDeploymentName、ModelName というディメンションで分割を適用したりできます。
RAITotalRequests 数える 合計 (和) RegionModelDeploymentNameModelNameModelVersionApiName PT1M イエス

カテゴリ: コンテンツセーフティ - 使用

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
イメージ モデレーションの呼び出し数

イメージ モデレーションの呼び出しの数。
ContentSafetyImageAnalyzeRequestCount 数える 合計 (和) ApiVersion PT1M イエス
テキスト モデレーションの呼び出し数

テキスト モデレーションの呼び出しの数。
ContentSafetyTextAnalyzeRequestCount 数える 合計 (和) ApiVersion PT1M イエス

カテゴリ: 見積もり

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
ベースラインランダムイベント数

ベースライン ランダム イベント数の推定。
BaselineRandomEventCount 数える 合計 (和) ModeRunId PT1M イエス
ベースラインランダム報酬

ベースライン ランダム報酬の推定。
BaselineRandomReward 数える 合計 (和) ModeRunId PT1M イエス
オンライン イベント数

オンライン イベント数の推定。
OnlineEventCount 数える 合計 (和) ModeRunId PT1M イエス
オンラインリワード

オンライン報酬の推定。
OnlineReward 数える 合計 (和) ModeRunId PT1M イエス
ユーザー ベースライン イベント数

ユーザー定義のベースライン イベント数の推定。
UserBaselineEventCount 数える 合計 (和) ModeRunId PT1M イエス
ユーザー ベースライン報酬

ユーザー定義のベースライン報酬の推定。
UserBaselineReward 数える 合計 (和) ModeRunId PT1M イエス

カテゴリ: 機能の発生件数

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
アクション機能の出現回数

各アクション特徴が出現する回数。
ActionFeatureIdOccurrences 数える 合計 (和) FeatureIdModeRunId PT1M イエス
コンテキスト機能の出現

各コンテキスト特徴が出現する回数。
ContextFeatureIdOccurrences 数える 合計 (和) FeatureIdModeRunId PT1M イエス
スロットフィーチャーの出現回数

各スロット特徴が出現する回数。
SlotFeatureIdOccurrences 数える 合計 (和) FeatureIdModeRunId PT1M イエス

カテゴリ: FeatureCardinality

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
アクション別の特徴カーディナリティ

アクションに基づく特徴カーディナリティ。
FeatureCardinality_Action 数える 平均 FeatureIdModeRunId PT1M イエス
コンテキスト別の特徴カーディナリティ

コンテキストに基づく特徴カーディナリティ。
FeatureCardinality_Context 数える 平均 FeatureIdModeRunId PT1M イエス
スロット別の特徴カーディナリティ

スロットに基づく特徴カーディナリティ。
FeatureCardinality_Slot 数える 平均 FeatureIdModeRunId PT1M イエス

カテゴリ: イベントごとの機能

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
イベントごとのアクション機能

イベントあたりのアクション特徴の平均数。
ActionFeaturesPerEvent 数える 平均 ModeRunId PT1M イエス
イベントごとのコンテキスト機能

イベントあたりのコンテキスト特徴の数。
ContextFeaturesPerEvent 数える 平均 ModeRunId PT1M イエス
イベントごとのスロット機能

イベントあたりのスロット特徴の平均数。
SlotFeaturesPerEvent 数える 平均 ModeRunId PT1M イエス

カテゴリ: 言語 - ジョブ

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
ジョブの期間 (プレビュー)

注: この値は、入力サイズ、ドキュメント数、タスクの複雑さに大きく依存します。 これは、すべてのジョブ タスクの集計値です。
JobDuration ミリ秒 最小値、最大値、平均値 JobStatusJobType PT1M イエス

カテゴリ: モデル - HTTP 要求

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
モデルの可用性率

次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。
ModelAvailabilityRate パーセント 最小値、最大値、平均値 RegionModelDeploymentNameModelNameModelVersion PT1M いいえ
モデル要求

一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
ModelRequests 数える 合計 (和) ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス

カテゴリ: モデル - 待機時間

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
トークン間の時間

ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。
NormalizedTimeBetweenTokens ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
正規化された最初のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
NormalizedTimeToFirstToken ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
最後のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
TimeToLastByte ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
Time to Response

ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。

注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。
TimeToResponse ミリ秒 最小値、最大値、平均値 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス
1 秒あたりのトークン数

特定のモデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。
TokensPerSecond 数える 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス

カテゴリ: モデル - 使用法

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
入力トークン

モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
InputTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス
出力トークン

OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
OutputTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス
プロビジョニングされた使用率

プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。
ProvisionedUtilization パーセント 最小値、最大値、平均値 RegionModelDeploymentNameModelNameModelVersion PT1M いいえ
合計トークン数

モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
TotalTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス

カテゴリ: イベントあたりの名前空間数

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
イベントごとのアクション名前空間

イベントあたりのアクション名前空間の平均数。
ActionNamespacesPerEvent 数える 平均 ModeRunId PT1M イエス
イベントごとのコンテキスト名前空間

イベントあたりのコンテキスト名前空間の数。
ContextNamespacesPerEvent 数える 平均 ModeRunId PT1M イエス
イベントあたりのスロット名前空間数

イベントあたりのスロット名前空間の平均数。
SlotNamespacesPerEvent 数える 平均 ModeRunId PT1M イエス

カテゴリ: リワード

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
イベントあたりの平均報酬

イベントあたりの平均報酬。
Reward 数える 平均 BaselineActionChosenActionIdMatchesBaselineNonDefaultRewardModeRunId PT1M イエス
スロットリワード

スロットあたりの報酬。
SlotReward 数える 平均 BaselineActionIdChosenActionIdMatchesBaselineNonDefaultRewardSlotIdSlotIndexModeRunId PT1M イエス

カテゴリ: スロット

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
ベースライン推定器の全体的な報酬

Baseline Estimator Overall Reward (ベースライン推定器の全体的な報酬)。
BaselineEstimatorOverallReward 数える 平均 ModeRunId PT1M イエス
ベースライン推定器スロット報酬

スロットごとのベースライン評価報酬。
BaselineEstimatorSlotReward 数える 平均 SlotIdSlotIndexModeRunId PT1M イエス
ベースライン ランダム推定器の全体的な報酬

Baseline Random Estimator Overall Reward (ベースライン ランダム推定器の全体的な報酬)。
BaselineRandomEstimatorOverallReward 数える 平均 ModeRunId PT1M イエス
ベースラインランダムエスティメータースロット報酬

スロット別のベースライン ランダム推定器報酬。
BaselineRandomEstimatorSlotReward 数える 平均 SlotIdSlotIndexModeRunId PT1M イエス
スロット

イベントあたりのスロットの数。
NumberOfSlots 数える 平均 ModeRunId PT1M イエス
オンライン推定器の全体的な報酬

Online Estimator Overall Reward (オンライン推定器の全体的な報酬)。
OnlineEstimatorOverallReward 数える 平均 ModeRunId PT1M イエス
オンライン推定器スロット報酬

スロット別のオンライン推定報酬。
OnlineEstimatorSlotReward 数える 平均 SlotIdSlotIndexModeRunId PT1M イエス
スロットの出現回数

各スロットが出現する回数。
SlotIdOccurrences 数える 合計 (和) SlotIdSlotIndexModeRunId PT1M イエス

カテゴリ: SpeechServices - 使用

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
書き起こされたオーディオの秒数

書き起こしの秒数
AudioSecondsTranscribed 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
翻訳されたオーディオの秒数

翻訳の秒数
AudioSecondsTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
アバター モデル ホスティング秒数

秒数。
AvatarModelHostingSeconds 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
アバター モデル トレーニング秒数

秒数。
AvatarModelTrainingSeconds 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
話者プロファイルの数

登録されたスピーカー プロファイルの数。 時間単位で按分されます。
NumberofSpeakerProfiles 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
話者認識トランザクション

話者認識トランザクションの数
SpeakerRecognitionTransactions 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
Speech モデルのホスティング時間

音声モデルのホスティング時間数
SpeechModelHostingHours 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
合成された文字数

文字数。
SynthesizedCharacters 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
合成されたビデオの秒数

合成された秒数
VideoSecondsSynthesized 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
音声モデル ホスティング時間

時間数。
VoiceModelHostingHours 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
音声モデルの学習時間

分数。
VoiceModelTrainingMinutes 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス

カテゴリ: 使用

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
推論の数

Carnegie Frontdoor Service の推論数
CarnegieInferenceCount 数える 合計 (和) RegionModalityCategoryLanguageSeverityLevelUseCustomList PT1M イエス
訓練済みキャラクター (廃止済み)

トレーニングされた文字の合計数。
CharactersTrained 数える 合計 (和) ApiNameOperationNameRegion PT1M イエス
翻訳された文字 (非推奨)

受信テキスト要求の合計文字数。
CharactersTranslated 数える 合計 (和) ApiNameOperationNameRegion PT1M イエス
コンピュータビジョン取引

Computer Vision のトランザクションの数
ComputerVisionTransactions 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
Custom Vision のトレーニング時間

Custom Vision のトレーニング時間
CustomVisionTrainingTime 秒数 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
カスタムビジョン取引

Custom Vision 予測トランザクションの数
CustomVisionTransactions 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
翻訳されたドキュメント文字

ドキュメント翻訳要求の文字数。
DocumentCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
翻訳されたカスタム文字をドキュメント化する

カスタム ドキュメント翻訳要求の文字数。
DocumentCustomCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
トレーニング済みの顔画像

トレーニングされたイメージの数。 トランザクションごとにトレーニングされた 1,000 のイメージ。
FaceImagesTrained 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
保存されている顔

1 日に日分けして格納された顔の数。 格納されている顔の数は毎日報告されます。
FacesStored 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
Face Transactions

Face サービスに対して行われた API 呼び出しの数
FaceTransactions 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
保存されたイメージ

格納されている Custom Vision イメージの数。
ImagesStored 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
学習済みイベント

学習したイベントの数。
LearnedEvents 数える 合計 (和) IsMatchBaselineModeRunId PT1M イエス
LUIS 音声リクエスト

LUIS 音声意図判定の解釈要求の数
LUISSpeechRequests 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
LUIS テキスト要求

LUIS テキスト要求の数
LUISTextRequests 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
一致した報酬

一致した報酬の数。
MatchedRewards 数える 合計 (和) ModeRunId PT1M イエス
非アクティブ化イベント

スキップしたイベントの数。
NonActivatedEvents 数える 合計 (和) ModeRunId PT1M イエス
観察された報酬

観察された報酬の数。
ObservedRewards 数える 合計 (和) ModeRunId PT1M イエス
翻訳されたドキュメント同期文字

ドキュメント変換 (同期) 要求の文字数。
OneDocumentCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
カスタム文字が翻訳されたドキュメント同期

カスタム ドキュメント翻訳 (同期) 要求の文字数。
OneDocumentCustomCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
処理された文字

Immersive Reader によって処理された文字数。
ProcessedCharacters 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
処理された正常性テキスト レコード

処理された健康関連テキストレコードの数
ProcessedHealthTextRecords 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
処理されたイメージ

処理されたイメージの数
ProcessedImages 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
処理済みページ

処理されたページの数
ProcessedPages 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
処理されたテキスト レコード

テキストレコードの総数。
ProcessedTextRecords 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
QA テキスト レコード

処理されたテキスト レコードの数
QuestionAnsweringTextRecords 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
音声セッションの期間 (非推奨)

音声セッションの合計継続時間 (秒)。
SpeechSessionDuration 秒数 合計 (和) ApiNameOperationNameRegion PT1M イエス
翻訳されたテキスト文字

受信テキスト翻訳要求の文字数。
TextCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
翻訳されたテキスト カスタム文字

受信カスタム テキスト翻訳要求の文字数。
TextCustomCharactersTranslated 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
テキストトレーニング済み文字

テキスト翻訳を使用してトレーニングされた文字数。
TextTrainedCharacters 数える 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス
合計イベント数

イベント数。
TotalEvents 数える 合計 (和) ModeRunId PT1M イエス
合計トランザクション数 (非推奨)

トランザクションの合計数。
TotalTransactions 数える 合計 (和) <なし> PT1M イエス
Translator Pro アプリの秒数

Translator Pro アプリの使用秒数。
TranslatorProAppSeconds 秒数 合計 (和) ApiNameFeatureNameUsageChannelRegion PT1M イエス

メトリック ディメンション

メトリック ディメンションについては、「多次元メトリック」を参照してください。

このサービスでは、次のディメンションがそのメトリックに関連付けられています。

  • ApiName
  • 機能名
  • ModelDeploymentName
  • モデル名
  • モデルバージョン
  • オペレーションネーム
  • リージョン
  • ステータスコード
  • ストリームタイプ
  • UsageChannel

リソース ログ

このセクションでは、このサービス用に収集できるリソース ログの種類を一覧表示します。 このセクションでは、Azure Monitor でサポートされているすべてのリソース ログ カテゴリの種類のリストからプルされます。

Microsoft.CognitiveServices/accounts でサポートされているリソース ログ

カテゴリ カテゴリの表示名 ログテーブル 基本ログプランをサポートします インジェスト時変換をサポート クエリの例 エクスポートのコスト
Audit 監査ログ AzureDiagnostics

複数の Azure リソースからのログ。

いいえ いいえ いいえ
AzureOpenAIRequestUsage Azure OpenAI 要求の使用状況 AzureDiagnostics

複数の Azure リソースからのログ。

いいえ いいえ イエス
RequestResponse 要求と応答のログ AzureDiagnostics

複数の Azure リソースからのログ。

いいえ いいえ いいえ
Trace トレース ログ AzureDiagnostics

複数の Azure リソースからのログ。

いいえ いいえ いいえ

Azure Monitor ログ テーブル

このセクションでは、Kusto クエリを使用した Log Analytics によるクエリに使用できる、このサービスに関連するすべての Azure Monitor ログ テーブルを一覧表示します。 テーブルにはリソース ログ データが含まれており、収集されルーティングされる内容によっては、さらに多くのデータが含まれる場合があります。

Azure OpenAI microsoft.cognitiveservices/accounts

アクティビティ ログ

リンクされたテーブルには、このサービスのアクティビティ ログに記録できる操作が一覧表示されます。 これらの操作は、アクティビティ ログで使用可能なすべてのリソース プロバイダー操作のサブセットです。

アクティビティ ログ エントリのスキーマの詳細については、「アクティビティ ログのスキーマ」を参照してください。