この記事には、このサービスに関するすべての監視リファレンス情報が含まれています。
Azure AI Foundry モデルで Azure OpenAI 用に収集できるデータとその使用方法の詳細については、Azure OpenAI の監視に関するページを参照してください。
メトリック
このセクションには、このサービスに関して自動的に収集されるすべてのプラットフォーム メトリックが一覧表示されています。 これらのメトリックは、Azure Monitor でサポートされているすべてのプラットフォーム メトリックのグローバル リストにも含まれています。
メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。
Microsoft.CognitiveServices/accounts でサポートされているメトリック
Azure OpenAI を監視する必要があると考える最も重要なメトリックを次に示します。 この記事の後半では、この短いリストのメトリックの詳細を含む、この名前空間で使用可能なすべてのメトリックの長い一覧を示します。 最新の情報については、以下の一覧を参照してください。 次のセクションでは、テーブルの更新に取り組んでいます。
- Azure OpenAI 要求
- アクティブ トークン
- 生成された完了トークン数
- Processed FineTuned Training Hours (FineTuned 処理済みトレーニング時間)
- Processed Ada Inference Tokens (処理済み推論トークン)
- 処理されたプロンプト トークン数
- プロビジョニングされたマネージド使用率 V2
- プロンプト トークン キャッシュの一致率
- Time to Response
- トークン間の時間
- 最後のバイトまでの時間
- 正規化された時刻から最初のバイト
- 1 秒あたりのトークン数
また、他の関連サービスで使用されているコンテンツの安全性メトリックを監視することもできます。
- ブロックされたボリューム
- 有害なボリュームが検出されました
- 潜在的な不正なユーザー数
- 安全システムイベント
- 安全性チェックのために送信された合計ボリューム
注
プロビジョニングされたマネージド使用率メトリックは非推奨になり、推奨されなくなりました。 このメトリックは、プロビジョニングされたマネージド使用率 V2 メトリックに置き替えられました。 現時点では、1 秒あたりのトークン数、Time to Response、Time Between Tokens は、Standard デプロイでは使用できません。
Cognitive Services メトリックには、次の表 Cognitive Services - HTTP 要求 カテゴリがあります。 これらのメトリックは、この種類のすべてのリソースに共通するレガシ メトリックです。 Microsoft では、これらのメトリックを Azure OpenAI で使用することは推奨されなくなりました。
次の表に、Microsoft.CognitiveServices/accounts リソースの種類で使用できるメトリックの一覧を示します。
- すべての列がすべてのテーブルに存在しないことがあります。
- 一部の列がページの表示領域を超えている場合があります。 [テーブルの展開] を選択すると、使用可能なすべての列が表示されます。
テーブルの見出し
- カテゴリ - メトリック グループまたは分類。
- メトリック - Azure Portal に表示されるメトリックの表示名。
- REST API の名前 - REST API で参照されるメトリック名。
- 単位 - 測定単位。
- 集計 - 既定の集計の種類。 有効な値: 平均 (Avg)、最小 (Min)、最大 (Max)、合計 (Sum)、数。
- ディメンション - メトリックで使用できるディメンション。
-
時間グレイン - メトリックをサンプリングする間隔。 たとえば、
PT1M
は、メトリックを 1 分ごとに、PT30M
は 30 分ごとに、PT1H
は 1 時間ごとにサンプリングすることを示します。 - DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。 メトリックのエクスポートについては、「Azure Monitor で診断設定を作成する」を参照してください。
カテゴリ: アクション
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
アクションの発生 各アクションが出現する回数。 |
ActionIdOccurrences |
カウント | 合計 (和) |
ActionId 、 Mode 、 RunId |
PT1M | はい |
イベントあたりのアクション数 イベントあたりのアクション数。 |
ActionsPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
カテゴリ: Azure OpenAI - HTTP 要求
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
Azure OpenAI AvailabilityRate 次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 |
AzureOpenAIAvailabilityRate |
パーセント | Minimum、Maximum、Average |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
Azure OpenAI 要求 一定期間に Azure OpenAI API に対して行われた呼び出しの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StatusCode (成功、クライアント エラー、サーバー エラー)、StreamType (ストリーミング要求と非ストリーミング要求)、および操作のディメンションで分割を適用できます。 |
AzureOpenAIRequests |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 StatusCode |
PT1M | はい |
カテゴリ: Azure OpenAI - 待機時間
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
トークン間の時間 ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
AzureOpenAINormalizedTBTInMS |
ミリ秒 | 最大、最小、平均 |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
正規化された時刻から最初のバイト ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
AzureOpenAINormalizedTTFTInMS |
ミリ秒 | 最大、最小、平均 |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。 注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。 |
AzureOpenAITimeToResponse |
ミリ秒 | Minimum、Maximum、Average |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 StatusCode |
PT1M | はい |
1 秒あたりのトークン数 特定の Azure OpenAI モデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
AzureOpenAITokenPerSecond |
カウント | 最大、最小、平均 |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
最後のバイトまでの時間 ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
AzureOpenAITTLTInMS |
ミリ秒 | 最大、最小、平均 |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
カテゴリ: Azure OpenAI - 使用状況
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
アクティブ トークン トークンの合計から一定期間にキャッシュされたトークンを差し引いた値。 PTU と PTU で管理されるデプロイに適用されます。 このメトリックを使用して、PTU の TPS または TPM ベースの使用率を把握し、シナリオのターゲット TPS または TPM のベンチマークと比較します。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、および ModelVersion というディメンションで分割を適用できます。 |
ActiveTokens |
カウント | Minimum、Maximum、Average、Total (Sum) |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
オーディオ補完トークン OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。 |
AudioCompletionTokens |
カウント | 合計 (和) |
ModelDeploymentName 、 ModelName 、 ModelVersion 、 Region |
PT1M | はい |
オーディオ プロンプト トークン OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。 |
AudioPromptTokens |
カウント | 合計 (和) |
ModelDeploymentName 、 ModelName 、 ModelVersion 、 Region |
PT1M | はい |
プロンプト トークン キャッシュの一致率 キャッシュにヒットしたプロンプト トークンの割合。 PTU と PTU で管理されるデプロイに適用されます。 |
AzureOpenAIContextTokensCacheMatchRate |
パーセント | Minimum、Maximum、Average |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
プロビジョニングされたマネージド使用率 (非推奨) (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージド デプロイの使用率 %。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。 |
AzureOpenAIProvisionedManagedUtilization |
パーセント | Minimum、Maximum、Average |
Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
プロビジョニングされたマネージド使用率 V2 (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージド デプロイの使用率 %。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。 |
AzureOpenAIProvisionedManagedUtilizationV2 |
パーセント | Minimum、Maximum、Average |
Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
処理済み FineTuned トレーニング時間 FineTuned モデルで処理されたトレーニング時間数 |
FineTunedTrainingHours |
カウント | 合計 (和) |
ApiName 、 ModelDeploymentName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
生成された完了トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。 |
GeneratedTokens |
カウント | 合計 (和) |
ApiName 、 ModelDeploymentName 、 FeatureName 、 UsageChannel 、 Region 、 ModelVersion |
PT1M | はい |
処理されたプロンプト トークン OpenAI モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。 |
ProcessedPromptTokens |
カウント | 合計 (和) |
ApiName 、 ModelDeploymentName 、 FeatureName 、 UsageChannel 、 Region 、 ModelVersion |
PT1M | はい |
処理された推論トークン OpenAI モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。 |
TokenTransaction |
カウント | 合計 (和) |
ApiName 、 ModelDeploymentName 、 FeatureName 、 UsageChannel 、 Region 、 ModelVersion |
PT1M | はい |
カテゴリ: Cognitive Services - HTTP 要求
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
ブロックされた呼び出し レートまたはクォータの制限を超えた呼び出しの回数。 Azure OpenAI サービスには使用しないでください。 |
BlockedCalls |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
クライアント エラー クライアント側のエラー (HTTP 応答コード 4xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。 |
ClientErrors |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
受信データ 受信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。 |
DataIn |
バイト | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
送信データ 送信データのサイズ (バイト)。 Azure OpenAI サービスには使用しないでください。 |
DataOut |
バイト | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
待機時間 待機時間 (ミリ秒)。 Azure OpenAI サービスには使用しないでください。 |
Latency |
ミリ秒 | 平均 |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
Ratelimit ratelimit キーの現在の ratelimit。 Azure OpenAI サービスには使用しないでください。 |
Ratelimit |
カウント | 合計 (和) |
Region 、RatelimitKey |
PT1M | はい |
サーバー エラー サービスの内部エラー (HTTP 応答コード 5xx) があった呼び出しの回数。 Azure OpenAI サービスには使用しないでください。 |
ServerErrors |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
成功した呼び出し 成功した呼び出しの数。 Azure OpenAI サービスには使用しないでください。 |
SuccessfulCalls |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
合計通話数 コールの合計数。 Azure OpenAI サービスには使用しないでください。 |
TotalCalls |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
合計エラー数 エラー応答 (HTTP 応答コード 4xx または 5xx) があった呼び出しの合計回数。 Azure OpenAI サービスには使用しないでください。 |
TotalErrors |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | はい |
トークン呼び出しの合計数 トークン呼び出しの合計回数。 |
TotalTokenCalls |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
カテゴリ: Cognitive Services - SLI
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
AvailabilityRate 次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 Azure OpenAI サービスには使用しないでください。 |
SuccessRate |
パーセント | Minimum、Maximum、Average |
ApiName 、 OperationName 、 Region 、 RatelimitKey |
PT1M | いいえ |
カテゴリ: ContentSafety - リスクと安全性
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
悪用される可能性のあるユーザー数 一定期間に検出された、悪用される可能性のあるユーザーの数。 フィルターを追加するか、次のディメンションで分割を適用できます: ModelDeploymentName。 |
RAIAbusiveUsersCount |
カウント | 合計 (和) |
Region 、ModelDeploymentName |
PT1M | はい |
有害なボリュームが検出されました Azure OpenAI API に対して行われ、一定期間にわたって適用されたコンテンツ フィルターによって有害 (ブロック モデルと注釈モードの両方) として検出された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。 |
RAIHarmfulRequests |
カウント | 合計 (和) |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 ApiName 、 TextType 、 Category 、 Severity |
PT1M | はい |
ブロックされたボリューム Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツ フィルターによって拒否された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。 |
RAIRejectedRequests |
カウント | 合計 (和) |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 ApiName 、 TextType 、 Category |
PT1M | はい |
安全システムイベント リスクと安全性の監視のためのシステム イベント。 フィルターを追加するか、次のディメンションで分割を適用できます: EventType。 |
RAISystemEvent |
カウント | 平均 |
Region 、EventType |
PT1M | はい |
安全性チェックのために送信された合計ボリューム Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツ フィルターによって検出された呼び出しの数。 フィルターを追加したり、ModelDeploymentName、ModelName というディメンションで分割を適用したりできます。 |
RAITotalRequests |
カウント | 合計 (和) |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 ApiName |
PT1M | はい |
カテゴリ: ContentSafety - Usage
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
イメージ モデレーションの呼び出し数 イメージ モデレーションの呼び出しの数。 |
ContentSafetyImageAnalyzeRequestCount |
カウント | 合計 (和) | ApiVersion |
PT1M | はい |
テキスト モデレーションの呼び出し数 テキスト モデレーションの呼び出しの数。 |
ContentSafetyTextAnalyzeRequestCount |
カウント | 合計 (和) | ApiVersion |
PT1M | はい |
カテゴリ: 見積もり
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
ベースラインランダムイベント数 ベースライン ランダム イベント数の推定。 |
BaselineRandomEventCount |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
ベースラインランダム報酬 ベースライン ランダム報酬の推定。 |
BaselineRandomReward |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
オンライン イベント数 オンライン イベント数の推定。 |
OnlineEventCount |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
オンラインリワード オンライン報酬の推定。 |
OnlineReward |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
ユーザー ベースライン イベント数 ユーザー定義のベースライン イベント数の推定。 |
UserBaselineEventCount |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
ユーザー ベースライン報酬 ユーザー定義のベースライン報酬の推定。 |
UserBaselineReward |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
カテゴリ: 特徴の発生
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
アクション機能の出現回数 各アクション特徴が出現する回数。 |
ActionFeatureIdOccurrences |
カウント | 合計 (和) |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
コンテキスト機能の出現 各コンテキスト特徴が出現する回数。 |
ContextFeatureIdOccurrences |
カウント | 合計 (和) |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
スロットフィーチャーの出現回数 各スロット特徴が出現する回数。 |
SlotFeatureIdOccurrences |
カウント | 合計 (和) |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
カテゴリ: FeatureCardinality
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
アクション別の特徴カーディナリティ アクションに基づく特徴カーディナリティ。 |
FeatureCardinality_Action |
カウント | 平均 |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
コンテキスト別の特徴カーディナリティ コンテキストに基づく特徴カーディナリティ。 |
FeatureCardinality_Context |
カウント | 平均 |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
スロットごとの特徴カーディナリティ スロットに基づく特徴カーディナリティ。 |
FeatureCardinality_Slot |
カウント | 平均 |
FeatureId 、 Mode 、 RunId |
PT1M | はい |
カテゴリ: イベントごとの機能
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
イベントごとのアクション機能 イベントあたりのアクション特徴の平均数。 |
ActionFeaturesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
イベントごとのコンテキスト機能 イベントあたりのコンテキスト特徴の数。 |
ContextFeaturesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
イベントごとのスロット機能 イベントあたりのスロット特徴の平均数。 |
SlotFeaturesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
カテゴリ: 言語 - ジョブ
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
ジョブの期間 (プレビュー) 注: この値は、入力サイズ、ドキュメント数、タスクの複雑さに大きく依存します。 これは、すべてのジョブ タスクの集計値です。 |
JobDuration |
ミリ秒 | Minimum、Maximum、Average |
JobStatus 、JobType |
PT1M | はい |
カテゴリ: モデル - HTTP 要求
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
モデルの可用性率 次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 |
ModelAvailabilityRate |
パーセント | Minimum、Maximum、Average |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
モデル要求 一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
ModelRequests |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 StatusCode |
PT1M | はい |
カテゴリ: モデル - 待機時間
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
トークン間の時間 ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。 |
NormalizedTimeBetweenTokens |
ミリ秒 | 最大、最小、平均 |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
正規化された時刻から最初のバイト ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
NormalizedTimeToFirstToken |
ミリ秒 | 最大、最小、平均 |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
最後のバイトまでの時間 ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
TimeToLastByte |
ミリ秒 | 最大、最小、平均 |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。 注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。 |
TimeToResponse |
ミリ秒 | Minimum、Maximum、Average |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion 、 StatusCode |
PT1M | はい |
1 秒あたりのトークン数 特定のモデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。 |
TokensPerSecond |
カウント | 最大、最小、平均 |
ApiName 、 OperationName 、 Region 、 StreamType 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
カテゴリ: モデル - 使用法
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
入力トークン モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
InputTokens |
カウント | 合計 (和) |
ApiName 、 Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
出力トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
OutputTokens |
カウント | 合計 (和) |
ApiName 、 Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
プロビジョニングされた使用率 (PTU 消費/デプロイされた PTU) x 100 として計算された、プロビジョニングされたマネージド デプロイの使用率 %。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 |
ProvisionedUtilization |
パーセント | Minimum、Maximum、Average |
Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | いいえ |
合計トークン数 モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 |
TotalTokens |
カウント | 合計 (和) |
ApiName 、 Region 、 ModelDeploymentName 、 ModelName 、 ModelVersion |
PT1M | はい |
カテゴリ: イベントごとの名前空間
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
イベントごとのアクション名前空間 イベントあたりのアクション名前空間の平均数。 |
ActionNamespacesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
イベントごとのコンテキスト名前空間 イベントあたりのコンテキスト名前空間の数。 |
ContextNamespacesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
イベントごとのスロット名前空間 イベントあたりのスロット名前空間の平均数。 |
SlotNamespacesPerEvent |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
カテゴリ: リワード
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
イベントあたりの平均報酬 イベントあたりの平均報酬。 |
Reward |
カウント | 平均 |
BaselineAction 、 ChosenActionId 、 MatchesBaseline 、 NonDefaultReward 、 Mode 、 RunId |
PT1M | はい |
スロットリワード スロットあたりの報酬。 |
SlotReward |
カウント | 平均 |
BaselineActionId 、 ChosenActionId 、 MatchesBaseline 、 NonDefaultReward 、 SlotId 、 SlotIndex 、 Mode 、 RunId |
PT1M | はい |
カテゴリ: スロット
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
ベースライン推定器の全体的な報酬 Baseline Estimator Overall Reward (ベースライン推定器の全体的な報酬)。 |
BaselineEstimatorOverallReward |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
ベースライン推定スロット報酬 スロット別のベースライン推定器報酬。 |
BaselineEstimatorSlotReward |
カウント | 平均 |
SlotId 、 SlotIndex 、 Mode 、 RunId |
PT1M | はい |
ベースライン ランダム推定器の全体的な報酬 Baseline Random Estimator Overall Reward (ベースライン ランダム推定器の全体的な報酬)。 |
BaselineRandomEstimatorOverallReward |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
ベースラインランダムエスティメータースロット報酬 スロット別のベースライン ランダム推定器報酬。 |
BaselineRandomEstimatorSlotReward |
カウント | 平均 |
SlotId 、 SlotIndex 、 Mode 、 RunId |
PT1M | はい |
スロット イベントあたりのスロットの数。 |
NumberOfSlots |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
オンライン推定器の全体的な報酬 Online Estimator Overall Reward (オンライン推定器の全体的な報酬)。 |
OnlineEstimatorOverallReward |
カウント | 平均 |
Mode 、RunId |
PT1M | はい |
オンライン推定スロット報酬 スロット別のオンライン推定器報酬。 |
OnlineEstimatorSlotReward |
カウント | 平均 |
SlotId 、 SlotIndex 、 Mode 、 RunId |
PT1M | はい |
スロットの出現回数 各スロットが出現する回数。 |
SlotIdOccurrences |
カウント | 合計 (和) |
SlotId 、 SlotIndex 、 Mode 、 RunId |
PT1M | はい |
カテゴリ: SpeechServices - Usage
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
書き起こされたオーディオの秒数 書き起こしの秒数 |
AudioSecondsTranscribed |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
翻訳されたオーディオの秒数 翻訳の秒数 |
AudioSecondsTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
アバター モデル ホスティング秒数 秒数。 |
AvatarModelHostingSeconds |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
アバター モデル トレーニング秒数 秒数。 |
AvatarModelTrainingSeconds |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
話者プロファイルの数 登録されたスピーカー プロファイルの数。 一時間ごとに日分けされます。 |
NumberofSpeakerProfiles |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
話者認識トランザクション Speaker Recognition トランザクションの数 |
SpeakerRecognitionTransactions |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
Speech モデルのホスティング時間 音声モデル ホスティングの時間数 |
SpeechModelHostingHours |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
合成された文字数 文字数。 |
SynthesizedCharacters |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
合成されたビデオの秒数 合成された秒数 |
VideoSecondsSynthesized |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
音声モデル ホスティング時間 時間数。 |
VoiceModelHostingHours |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
音声モデル トレーニング分数 分数。 |
VoiceModelTrainingMinutes |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
カテゴリ: 使用
メトリック | REST API での名前 | 出荷単位 | 集計 | 次元 | 期間粒度 | DS エクスポート |
---|---|---|---|---|---|---|
推論の数 Carnegie Frontdoor Service の推論数 |
CarnegieInferenceCount |
カウント | 合計 (和) |
Region 、 Modality 、 Category 、 Language 、 SeverityLevel 、 UseCustomList |
PT1M | はい |
トレーニング済み文字 (非推奨) トレーニングされた文字の合計数。 |
CharactersTrained |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
翻訳された文字 (非推奨) 受信テキスト要求の合計文字数。 |
CharactersTranslated |
カウント | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
Computer Vision トランザクション Computer Vision のトランザクションの数 |
ComputerVisionTransactions |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
Custom Vision トレーニング時間 Custom Vision のトレーニング時間 |
CustomVisionTrainingTime |
秒 | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
Custom Vision トランザクション Custom Vision 予測トランザクションの数 |
CustomVisionTransactions |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
翻訳されたドキュメント文字 ドキュメント翻訳要求の文字数。 |
DocumentCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
翻訳されたカスタム文字をドキュメント化する カスタム ドキュメント翻訳要求の文字数。 |
DocumentCustomCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
トレーニング済みの顔画像 トレーニングされたイメージの数。 トランザクションごとにトレーニングされた 1,000 件のイメージ。 |
FaceImagesTrained |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
保存されている顔 1 日に日分けして格納された顔の数。 格納されている顔の数は毎日報告されます。 |
FacesStored |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
Face Transactions Face サービスに対して行われた API 呼び出しの数 |
FaceTransactions |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
保存されたイメージ 格納されている Custom Vision イメージの数。 |
ImagesStored |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
学習済みイベント 学習したイベントの数。 |
LearnedEvents |
カウント | 合計 (和) |
IsMatchBaseline 、 Mode 、 RunId |
PT1M | はい |
LUIS 音声リクエスト 意図を理解する要求に対する LUIS 音声の数 |
LUISSpeechRequests |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
LUIS テキスト要求 LUIS テキスト要求の数 |
LUISTextRequests |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
一致したリワード 一致した報酬の数。 |
MatchedRewards |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
非アクティブ化イベント スキップしたイベントの数。 |
NonActivatedEvents |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
観察された報酬 観察された報酬の数。 |
ObservedRewards |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
翻訳されたドキュメント同期文字 ドキュメント変換 (同期) 要求の文字数。 |
OneDocumentCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
翻訳されたドキュメント同期のカスタム文字 カスタム ドキュメント翻訳 (同期) 要求の文字数。 |
OneDocumentCustomCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
処理された文字 Immersive Reader によって処理された文字数。 |
ProcessedCharacters |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
処理された正常性テキスト レコード 処理された正常性テキスト レコードの数 |
ProcessedHealthTextRecords |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
処理されたイメージ 処理されたイメージの数 |
ProcessedImages |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
処理済みページ 処理されたページの数 |
ProcessedPages |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
処理されたテキスト レコード テキスト レコードの数。 |
ProcessedTextRecords |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
QA テキスト レコード 処理されたテキスト レコードの数 |
QuestionAnsweringTextRecords |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
Speech Session Duration (非推奨) 音声セッションの合計継続時間 (秒)。 |
SpeechSessionDuration |
秒 | 合計 (和) |
ApiName 、 OperationName 、 Region |
PT1M | はい |
翻訳されたテキスト文字 受信テキスト翻訳要求の文字数。 |
TextCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
翻訳されたテキスト カスタム文字 受信カスタム テキスト翻訳要求の文字数。 |
TextCustomCharactersTranslated |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
テキストトレーニング済み文字 テキスト翻訳を使用してトレーニングされた文字数。 |
TextTrainedCharacters |
カウント | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
合計イベント数 イベント数。 |
TotalEvents |
カウント | 合計 (和) |
Mode 、RunId |
PT1M | はい |
合計トランザクション数 (非推奨) トランザクションの合計数。 |
TotalTransactions |
カウント | 合計 (和) | <なし> | PT1M | はい |
Translator Pro アプリの秒数 Translator Pro アプリの使用秒数。 |
TranslatorProAppSeconds |
秒 | 合計 (和) |
ApiName 、 FeatureName 、 UsageChannel 、 Region |
PT1M | はい |
メトリック ディメンション
メトリック ディメンションについては、「多次元メトリック」を参照してください。
このサービスでは、次のディメンションがそのメトリックに関連付けられています。
- ApiName
- 機能名
- ModelDeploymentName
- モデル名
- モデルバージョン
- オペレーションネーム
- リージョン
- ステータスコード
- ストリームタイプ
- UsageChannel
リソース ログ
このセクションでは、このサービス用に収集できるリソース ログの種類を一覧表示します。 このセクションでは、Azure Monitor でサポートされているすべてのリソース ログ カテゴリの種類のリストからプルされます。
Microsoft.CognitiveServices/accounts でサポートされているリソース ログ
カテゴリ | カテゴリの表示名 | ログ テーブル | 基本ログ プランをサポート | インジェスト時間変換をサポート | クエリの例 | エクスポートするコスト |
---|---|---|---|---|---|---|
Audit |
監査ログ |
AzureDiagnostics 複数の Azure リソースからのログ。 |
いいえ | いいえ | いいえ | |
AzureOpenAIRequestUsage |
Azure OpenAI 要求の使用状況 |
AzureDiagnostics 複数の Azure リソースからのログ。 |
いいえ | いいえ | はい | |
RequestResponse |
要求と応答のログ |
AzureDiagnostics 複数の Azure リソースからのログ。 |
いいえ | いいえ | いいえ | |
Trace |
トレース ログ |
AzureDiagnostics 複数の Azure リソースからのログ。 |
いいえ | いいえ | いいえ |
Azure Monitor ログ テーブル
このセクションでは、Kusto クエリを使用した Log Analytics によるクエリに使用できる、このサービスに関連するすべての Azure Monitor ログ テーブルを一覧表示します。 テーブルにはリソース ログ データが含まれており、収集されルーティングされる内容によっては、さらに多くのデータが含まれる場合があります。
Azure OpenAI microsoft.cognitiveservices/accounts
アクティビティ ログ
リンクされたテーブルには、このサービスのアクティビティ ログに記録できる操作が一覧表示されます。 これらの操作は、アクティビティ ログで使用可能なすべてのリソース プロバイダー操作のサブセットです。
アクティビティ ログ エントリのスキーマの詳細については、「アクティビティ ログのスキーマ」を参照してください。
関連するコンテンツ
- Azure OpenAI の監視の詳細については、 Monitor Azure OpenAI を参照してください。
- Azure リソースの監視の詳細については、「Azure Monitor で Azure リソースを監視する」を参照してください。