你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Azure OpenAI 监视数据参考

2025-06-05

本文包含此服务的所有监视参考信息。

有关可在 Azure AI Foundry 模型中为 Azure OpenAI 收集的数据以及如何使用它的详细信息，请参阅 Monitor Azure OpenAI 。

指标

本部分列出了为此服务自动收集的所有平台指标。这些指标也是 Azure Monitor 中支持的所有平台指标的全局列表的一部分。

有关指标保留的信息，请参阅 Azure Monitor 指标概述。

Microsoft.CognitiveServices/accounts 支持的指标

下面是我们认为应该监视 Azure OpenAI 的最重要指标。本文的后面部分是此命名空间的所有可用指标的较长列表，其中包含有关此较短列表中指标的更多详细信息。 有关最新信息，请参阅下面的列表。我们正在努力刷新以下部分中的表。

Azure OpenAI 请求
有效令牌
生成的完成令牌
已处理的 FineTuned 训练小时数
已处理的推理令牌
已处理的提示令牌
预配管理的利用率 V2
提示令牌缓存匹配率
响应时间
令牌之间的时间
最后一个字节的时间
规范化时间到第一个字节
每秒令牌数

还可以监视其他相关服务使用的内容安全指标。

阻止的卷
检测到有害卷
潜在的滥用用户计数
安全系统事件
为安全检查发送的总卷

注意

经过预配和管理的利用率指标现已弃用，不再推荐使用。此指标已替换为经过预配和管理的利用率 V2 指标。令牌每秒、响应时间、令牌之间的时间目前不适用于标准部署。

认知服务指标具有认知服务 - 下表中的 HTTP 请求类别。这些指标是此类型的所有资源通用的旧指标。 Microsoft不再建议将这些指标用于 Azure OpenAI。

下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。

并非所有列都显示在每个表中。
某些列可能超出了页面的查看区域。选择“展开表”以查看所有可用列。

表标题

类别 - 指标组或分类。
指标 - 在 Azure 门户中显示的指标显示名称。
REST API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。有效值：平均值（平均）、最小值（最小值）、最大值（最大值）、总计（总和）、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。例如，PT1M 表示该指标每分钟采样一次，PT30M 表示每 30 分钟一次，PT1H 表示每小时一次，以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。要了解如何导出指标的信息，请参阅在 Azure Monitor 中创建诊断设置。

类别：作

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
操作出现次数每个操作的出现次数。	`ActionIdOccurrences`	计数	总计（总和）	`ActionId`、 `Mode`、、 `RunId`	PT1M	是
每个事件的操作数量每个事件的操作数量。	`ActionsPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是

类别：Azure OpenAI - HTTP 请求

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
Azure OpenAI AvailabilityRate 使用以下公式计算可用性百分比：(调用总数 - 服务器错误数)/调用总数。服务器错误包括任何 >=500 的 HTTP 响应。	`AzureOpenAIAvailabilityRate`	百分比	最小值、最大值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、、 `ModelNameModelVersion`	PT1M	否
Azure OpenAI 请求一段时间内对 Azure OpenAI API 的调用次数。适用于 PTU、PTU 托管和即用即付部署。若要细分 API 请求，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion、StatusCode（成功、客户端程序、服务器错误）、StreamType（流式处理请求和非流式处理请求）和操作。	`AzureOpenAIRequests`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、`ModelName`、、 `ModelVersionStatusCode`	PT1M	是

类别：Azure OpenAI - 延迟

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
令牌之间的时间对于流式处理请求;模型令牌生成速率，以毫秒为单位。适用于 PTU、PTU 托管的部署和即用即付部署。	`AzureOpenAINormalizedTBTInMS`	毫秒	最大值、最小值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	是
规范化时间到第一个字节对于流式处理和非流式处理请求;通过令牌规范化请求后接收第一字节响应数据所需的时间。适用于 PTU、PTU 托管和即用即付部署。	`AzureOpenAINormalizedTTFTInMS`	毫秒	最大值、最小值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	是
响应时间对于流式处理请求，建议使用延迟（响应能力）度量值。适用于 PTU、PTU 托管的部署和即用即付部署。按用户发送提示后出现第一个响应所需的时间计算，由 API 网关测量。随着提示大小增加和/或缓存命中大小减小，此数字将增加。若要细分响应指标的时间，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 ModelVersion。注意：此指标是一个近似值，因为测量的延迟在很大程度上取决于多个因素，包括并发调用和总体工作负载模式。此外，它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。有关最佳延迟跟踪，请参阅自己的日志记录。	`AzureOpenAITimeToResponse`	毫秒	最小值、最大值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、`ModelName`、、 `ModelVersionStatusCode`	PT1M	是
每秒令牌数枚举给定 Azure OpenAI 模型响应的生成速度。生成的令牌总数除以生成令牌的时间（以秒为单位）。适用于 PTU、PTU 托管的部署和即用即付部署。	`AzureOpenAITokenPerSecond`	计数	最大值、最小值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	是
最后一个字节的时间对于流式处理和非流式处理请求;在模型发出请求后接收最后一个字节响应数据所需的时间。适用于 PTU、PTU 托管和即用即付部署。	`AzureOpenAITTLTInMS`	毫秒	最大值、最小值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	是

类别：Azure OpenAI - 使用情况

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
有效令牌令牌总数减去一段时间内缓存的令牌。适用于 PTU 和 PTU 托管的部署。使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率，并将其与方案的目标 TPS 或 TPM 基准进行比较。若要细分 API 请求，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 ModelVersion。	`ActiveTokens`	计数	最小值、最大值、平均值、总计（求和）	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	是
音频完成令牌 OpenAI 模型上生成的音频提示令牌数（输出）。适用于 PTU 托管的即用即付模型部署。	`AudioCompletionTokens`	计数	总计（总和）	`ModelDeploymentName`、、`ModelNameModelVersion`、、`Region`	PT1M	是
音频提示令牌 OpenAI 模型上处理的音频提示令牌数（输入）。适用于 PTU 托管的即用即付模型部署。	`AudioPromptTokens`	计数	总计（总和）	`ModelDeploymentName`、、`ModelNameModelVersion`、、`Region`	PT1M	是
提示令牌缓存匹配率命中缓存的提示令牌的百分比。适用于 PTU 和 PTU 托管的部署。	`AzureOpenAIContextTokensCacheMatchRate`	百分比	最小值、最大值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	否
预配管理的利用率（已弃用）预配管理的部署的利用率百分比，计算公式为 (已使用的 PTU/已部署的 PTU) x 100。当利用率大于或等于 100% 时，调用将受到限制，并返回错误代码 429。若要细分此指标，可以添加一个筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion 和 StreamType（流式处理请求和非流式处理请求）	`AzureOpenAIProvisionedManagedUtilization`	百分比	最小值、最大值、平均值	`Region`、、`StreamTypeModelDeploymentName`、`ModelName`、`ModelVersion`	PT1M	否
预配管理的利用率 V2 预配管理的部署的利用率百分比，计算公式为 (已使用的 PTU/已部署的 PTU) x 100。当利用率大于或等于 100% 时，调用将受到限制，并返回错误代码 429。若要细分此指标，可以添加一个筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion 和 StreamType（流式处理请求和非流式处理请求）	`AzureOpenAIProvisionedManagedUtilizationV2`	百分比	最小值、最大值、平均值	`Region`、、`StreamTypeModelDeploymentName`、`ModelName`、`ModelVersion`	PT1M	否
已处理的 FineTuned 训练小时数在 OpenAI FineTuned 模型中处理的训练小时数	`FineTunedTrainingHours`	计数	总计（总和）	`ApiName`、、`ModelDeploymentNameFeatureName`、`UsageChannel`、`Region`	PT1M	是
生成的完成令牌从 OpenAI 模型生成（输出）的令牌数。适用于 PTU、PTU 托管的部署和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`GeneratedTokens`	计数	总计（总和）	`ApiName`、、`ModelDeploymentNameFeatureName`、`UsageChannel`、`Region`、`ModelVersion`	PT1M	是
已处理的提示令牌 OpenAI 模型上处理（输入）的提示令牌数。适用于 PTU、PTU 托管的部署和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`ProcessedPromptTokens`	计数	总计（总和）	`ApiName`、、`ModelDeploymentNameFeatureName`、`UsageChannel`、`Region`、`ModelVersion`	PT1M	是
已处理的推理令牌在 OpenAI 模型上处理的推理令牌数量。计算公式为提示令牌（输入）加上生成的令牌（输出）。适用于 PTU、PTU 托管的部署和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`TokenTransaction`	计数	总计（总和）	`ApiName`、、`ModelDeploymentNameFeatureName`、`UsageChannel`、`Region`、`ModelVersion`	PT1M	是

类别：认知服务 - HTTP 请求

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
阻止的调用数超过速率或配额限制的调用数。请勿用于 Azure OpenAI 服务。	`BlockedCalls`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
客户端错误数引发客户端错误（HTTP 响应代码 4xx）的调用数。请勿用于 Azure OpenAI 服务。	`ClientErrors`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
数据输入传入数据的大小（字节）。请勿用于 Azure OpenAI 服务。	`DataIn`	字节	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是
数据输出传出数据的大小（字节）。请勿用于 Azure OpenAI 服务。	`DataOut`	字节	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是
延迟延迟（毫秒）。请勿用于 Azure OpenAI 服务。	`Latency`	毫秒	平均值	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
Ratelimit ratelimit 键的当前速率限制。请勿用于 Azure OpenAI 服务。	`Ratelimit`	计数	总计（总和）	`Region`、`RatelimitKey`	PT1M	是
服务器错误数引发服务内部错误（HTTP 响应代码 5xx）的调用数。请勿用于 Azure OpenAI 服务。	`ServerErrors`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
成功调用数成功调用数。请勿用于 Azure OpenAI 服务。	`SuccessfulCalls`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
呼叫总数调用总数。请勿用于 Azure OpenAI 服务。	`TotalCalls`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
错误总数引发错误响应（HTTP 响应代码 4xx 或 5xx）的调用总数。请勿用于 Azure OpenAI 服务。	`TotalErrors`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	是
令牌调用总数令牌调用的总数。	`TotalTokenCalls`	计数	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是

类别：认知服务 - SLI

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
AvailabilityRate 使用以下公式计算可用性百分比：(调用总数 - 服务器错误数)/调用总数。服务器错误包括任何 >=500 的 HTTP 响应。请勿用于 Azure OpenAI 服务。	`SuccessRate`	百分比	最小值、最大值、平均值	`ApiName`、、`OperationNameRegion`、、`RatelimitKey`	PT1M	否

类别：ContentSafety - 风险&安全

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
潜在的滥用用户计数在一段时间内检测到的潜在滥用用户数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName。	`RAIAbusiveUsersCount`	计数	总计（总和）	`Region`、`ModelDeploymentName`	PT1M	是
检测到有害卷一段时间内应用的内容筛选器对 Azure OpenAI API 进行的并检测为有害（块模型和注释模式）的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 TextType。	`RAIHarmfulRequests`	计数	总计（总和）	`Region`、、`ModelDeploymentNameModelName`、`ModelVersion`、`ApiName`、`TextType`、、 `CategorySeverity`	PT1M	是
阻止的卷在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 TextType。	`RAIRejectedRequests`	计数	总计（总和）	`Region`、、`ModelDeploymentNameModelName`、`ModelVersion`、`ApiName`、、 `TextTypeCategory`	PT1M	是
安全系统事件用于风险与安全监视的系统事件。可以添加筛选器或按以下维度应用拆分：EventType。	`RAISystemEvent`	计数	平均值	`Region`、`EventType`	PT1M	是
为安全检查发送的总卷在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器检测的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName。	`RAITotalRequests`	计数	总计（总和）	`Region`、、`ModelDeploymentNameModelName`、`ModelVersion`、`ApiName`	PT1M	是

类别：ContentSafety - 用法

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
用于图像审查的调用计数用于图像审查的调用数。	`ContentSafetyImageAnalyzeRequestCount`	计数	总计（总和）	`ApiVersion`	PT1M	是
用于文本审查的调用计数用于文本审查的调用数。	`ContentSafetyTextAnalyzeRequestCount`	计数	总计（总和）	`ApiVersion`	PT1M	是

类别：估计

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
基线随机事件计数基线随机事件计数的估算值。	`BaselineRandomEventCount`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
基线随机奖励基线随机奖励的估算值。	`BaselineRandomReward`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
联机事件计数联机事件计数的估算值。	`OnlineEventCount`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
联机奖励联机奖励的估算值。	`OnlineReward`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
用户基线事件计数用户定义的基线事件计数的估算值。	`UserBaselineEventCount`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
用户基线奖励用户定义的基线奖励的估算值。	`UserBaselineReward`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是

类别：功能发生

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
操作特征出现次数每个操作特征的出现次数。	`ActionFeatureIdOccurrences`	计数	总计（总和）	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是
上下文特征出现次数每个上下文特征的出现次数。	`ContextFeatureIdOccurrences`	计数	总计（总和）	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是
槽特征出现次数每个槽特征的出现次数。	`SlotFeatureIdOccurrences`	计数	总计（总和）	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是

类别：FeatureCardinality

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
按操作列出的特征基数基于操作的特征基数。	`FeatureCardinality_Action`	计数	平均值	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是
按上下文列出的特征基数基于上下文的特征基数。	`FeatureCardinality_Context`	计数	平均值	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是
按槽列出的特征基数基于槽的特征基数。	`FeatureCardinality_Slot`	计数	平均值	`FeatureId`、 `Mode`、、 `RunId`	PT1M	是

类别：每个事件的功能

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
每个事件的操作特征数每个事件的平均操作特征数量。	`ActionFeaturesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是
每个事件的上下文特征数每个事件的上下文特征数量。	`ContextFeaturesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是
每个事件的槽特征数每个事件的平均槽特征数量。	`SlotFeaturesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是

类别：语言 - 作业

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
作业工期（预览版）注意：此值在很大程度上取决于输入大小、文档数量和任务的复杂性。这是所有作业任务的聚合值。	`JobDuration`	毫秒	最小值、最大值、平均值	`JobStatus`、`JobType`	PT1M	是

类别：模型 - HTTP 请求

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
模型可用性率使用以下公式计算可用性百分比：(调用总数 - 服务器错误数)/调用总数。服务器错误包括任何 >=500 的 HTTP 响应。	`ModelAvailabilityRate`	百分比	最小值、最大值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	否
模型请求在一段时间内对模型 API 进行的调用数。适用于 PTU、PTU 托管和即用即付部署。	`ModelRequests`	计数	总计（总和）	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、`ModelName`、、 `ModelVersionStatusCode`	PT1M	是

类别：模型 - 延迟

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
令牌之间的时间对于流式处理请求;模型令牌生成速率，以毫秒为单位。适用于 PTU 和 PTU 托管的部署。	`NormalizedTimeBetweenTokens`	毫秒	最大值、最小值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、、 `ModelNameModelVersion`	PT1M	是
规范化时间到第一个字节对于流式处理和非流式处理请求;通过令牌规范化请求后接收第一字节响应数据所需的时间。适用于 PTU、PTU 托管和即用即付部署。	`NormalizedTimeToFirstToken`	毫秒	最大值、最小值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、、 `ModelNameModelVersion`	PT1M	是
最后一个字节的时间对于流式处理和非流式处理请求;在模型发出请求后接收最后一个字节响应数据所需的时间。适用于 PTU、PTU 托管和即用即付部署。	`TimeToLastByte`	毫秒	最大值、最小值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、、 `ModelNameModelVersion`	PT1M	是
响应时间对于流式处理请求，建议使用延迟（响应能力）度量值。适用于 PTU 和 PTU 托管的部署。按用户发送提示后出现第一个响应所需的时间计算，由 API 网关测量。随着提示大小增加和/或缓存命中大小减小，此数字将增加。若要细分响应指标的时间，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 ModelVersion。注意：此指标是一个近似值，因为测量的延迟在很大程度上取决于多个因素，包括并发调用和总体工作负载模式。此外，它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。有关最佳延迟跟踪，请参阅自己的日志记录。	`TimeToResponse`	毫秒	最小值、最大值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、`ModelName`、、 `ModelVersionStatusCode`	PT1M	是
每秒令牌数枚举给定模型响应的生成速度。生成的令牌总数除以生成令牌的时间（以秒为单位）。适用于 PTU 和 PTU 托管的部署。	`TokensPerSecond`	计数	最大值、最小值、平均值	`ApiName`、、`OperationNameRegion`、`StreamType`、`ModelDeploymentName`、、 `ModelNameModelVersion`	PT1M	是

类别：模型 - 使用情况

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
输入标记在模型上处理（输入）的提示标记数量。适用于 PTU、PTU 托管和即用即付部署。	`InputTokens`	计数	总计（总和）	`ApiName`、、`RegionModelDeploymentName`、`ModelName`、`ModelVersion`	PT1M	是
输出令牌从 OpenAI 模型生成（输出）的令牌数。适用于 PTU、PTU 托管和即用即付部署。	`OutputTokens`	计数	总计（总和）	`ApiName`、、`RegionModelDeploymentName`、`ModelName`、`ModelVersion`	PT1M	是
预配利用率预配管理的部署的利用率百分比，计算公式为 (已使用的 PTU/已部署的 PTU) x 100。当利用率大于或等于 100% 时，调用将受到限制，并返回错误代码 429。	`ProvisionedUtilization`	百分比	最小值、最大值、平均值	`Region`、、`ModelDeploymentNameModelName`、、`ModelVersion`	PT1M	否
令牌总数在模型上处理的推理令牌数。计算公式为提示令牌（输入）加上生成的令牌（输出）。适用于 PTU、PTU 托管和即用即付部署。	`TotalTokens`	计数	总计（总和）	`ApiName`、、`RegionModelDeploymentName`、`ModelName`、`ModelVersion`	PT1M	是

类别：每个事件的命名空间

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
每个事件的操作命名空间数每个事件的平均操作命名空间数量。	`ActionNamespacesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是
每个事件的上下文命名空间数每个事件的上下文命名空间数量。	`ContextNamespacesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是
每个事件的槽命名空间数每个事件的平均槽命名空间数量。	`SlotNamespacesPerEvent`	计数	平均值	`Mode`、`RunId`	PT1M	是

类别：奖励

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
每个事件的平均奖励每个事件的平均奖励。	`Reward`	计数	平均值	`BaselineAction`、、`ChosenActionIdMatchesBaseline`、`NonDefaultReward`、`Mode`、`RunId`	PT1M	是
槽奖励每个槽的奖励。	`SlotReward`	计数	平均值	`BaselineActionId`、、`ChosenActionIdMatchesBaseline`、`NonDefaultReward`、`SlotId`、`SlotIndex`、、 `ModeRunId`	PT1M	是

类别：槽

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
基线估算器总奖励基线估算器总奖励。	`BaselineEstimatorOverallReward`	计数	平均值	`Mode`、`RunId`	PT1M	是
基线估算器槽奖励按槽列出的基线估算器奖励。	`BaselineEstimatorSlotReward`	计数	平均值	`SlotId`、、`SlotIndexMode`、、`RunId`	PT1M	是
基线随机估算器总奖励基线随机估算器总奖励。	`BaselineRandomEstimatorOverallReward`	计数	平均值	`Mode`、`RunId`	PT1M	是
基线随机估算器槽奖励按槽列出的基线随机估算器奖励。	`BaselineRandomEstimatorSlotReward`	计数	平均值	`SlotId`、、`SlotIndexMode`、、`RunId`	PT1M	是
槽每个事件的槽数。	`NumberOfSlots`	计数	平均值	`Mode`、`RunId`	PT1M	是
联机估算器总奖励联机估算器总奖励。	`OnlineEstimatorOverallReward`	计数	平均值	`Mode`、`RunId`	PT1M	是
联机估算器槽奖励按槽列出的联机估算器奖励。	`OnlineEstimatorSlotReward`	计数	平均值	`SlotId`、、`SlotIndexMode`、、`RunId`	PT1M	是
槽出现次数每个槽的出现次数。	`SlotIdOccurrences`	计数	总计（总和）	`SlotId`、、`SlotIndexMode`、、`RunId`	PT1M	是

类别：SpeechServices - 用法

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
转录的音频秒数转录的秒数	`AudioSecondsTranscribed`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
转换的音频秒数转换的秒数	`AudioSecondsTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
虚拟形象模型托管秒数秒数。	`AvatarModelHostingSeconds`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
虚拟形象模型训练秒秒数。	`AvatarModelTrainingSeconds`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
说话人配置文件数注册的说话人配置文件数。每小时按比例计算。	`NumberofSpeakerProfiles`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
说话人辨识事务说话人辨识事务数	`SpeakerRecognitionTransactions`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
语音模型托管时间语音模型托管时间数	`SpeechModelHostingHours`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
合成字符数字符数。	`SynthesizedCharacters`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
合成视频秒数合成的秒数	`VideoSecondsSynthesized`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
语音模型托管小时数小时数。	`VoiceModelHostingHours`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
语音模型训练分钟数分钟数。	`VoiceModelTrainingMinutes`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是

类别：使用情况

指标	REST API 中的名称	单位	聚合	维度	时间粒度	DS 导出
推理计数 Carnegie Frontdoor 服务的推理计数	`CarnegieInferenceCount`	计数	总计（总和）	`Region`、、`ModalityCategory`、`Language`、`SeverityLevel`、`UseCustomList`	PT1M	是
训练的字符数(已弃用) 训练的字符总数。	`CharactersTrained`	计数	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是
转换的字符数(已弃用) 传入的文本请求中的字符总数。	`CharactersTranslated`	计数	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是
计算机视觉事务计算机视觉事务数	`ComputerVisionTransactions`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
自定义视觉训练时间自定义视觉训练时间	`CustomVisionTrainingTime`	秒	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
自定义视觉事务自定义视觉预测事务数	`CustomVisionTransactions`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
转换的文档字符数文档翻译请求中的字符数。	`DocumentCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
转换的文档自定义字符数自定义文档翻译请求中的字符数。	`DocumentCustomCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
训练的人脸图像训练的图像数。每个事务训练 1,000 个图像。	`FaceImagesTrained`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
存储的人脸存储的人脸数，每日按比例计算。每日报告存储的人脸数。	`FacesStored`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
人脸事务对人脸服务进行 API 调用的数量	`FaceTransactions`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
存储的图像存储的自定义视觉图像数。	`ImagesStored`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
已了解的事件数已了解的事件数。	`LearnedEvents`	计数	总计（总和）	`IsMatchBaseline`、 `Mode`、、 `RunId`	PT1M	是
LUIS 语音请求 LUIS 语音转意向理解请求数	`LUISSpeechRequests`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
LUIS 文本请求 LUIS 文本请求数	`LUISTextRequests`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
匹配的奖励数匹配的奖励数。	`MatchedRewards`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
未激活的事件数跳过的事件数量。	`NonActivatedEvents`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
观察到的奖励数观察到的奖励数。	`ObservedRewards`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
转换的同步字符数文档翻译（同步）请求中的字符数。	`OneDocumentCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
已翻译文档同步自定义字符自定义文档翻译（同步）请求中的字符数。	`OneDocumentCustomCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
已处理的字符数沉浸式阅读器处理的字符数。	`ProcessedCharacters`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
处理的运行状况文本记录处理的运行状况文本记录数	`ProcessedHealthTextRecords`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
已处理的图像处理的图像数	`ProcessedImages`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
处理的页面处理的页面数	`ProcessedPages`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
已处理的文本记录数文本记录的计数。	`ProcessedTextRecords`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
QA 文本记录处理的文本记录数	`QuestionAnsweringTextRecords`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
语音会话持续时间(已弃用) 语音会话的总持续时间（以秒计）。	`SpeechSessionDuration`	秒	总计（总和）	`ApiName`、 `OperationName`、、 `Region`	PT1M	是
转换的文本字符数传入的文本翻译请求中的字符数。	`TextCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
转换的文本自定义字符数传入的自定义文本翻译请求中的字符数。	`TextCustomCharactersTranslated`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
训练的文本字符数使用文本翻译训练的字符数。	`TextTrainedCharacters`	计数	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是
事件总数事件数量。	`TotalEvents`	计数	总计（总和）	`Mode`、`RunId`	PT1M	是
总事务(已弃用) 事务总数。	`TotalTransactions`	计数	总计（总和）	<无>	PT1M	是
翻译专业应用秒翻译专业应用使用情况的秒数。	`TranslatorProAppSeconds`	秒	总计（总和）	`ApiName`、、`FeatureNameUsageChannel`、、`Region`	PT1M	是

指标维度

有关指标维度定义的信息，请参阅多维指标。

此服务具有以下与其指标关联的维度。

ApiName
功能名称
ModelDeploymentName
模型名
ModelVersion
操作名称
区域
状态码
StreamType
UsageChannel

资源日志

本部分列出了可为此服务收集的资源日志类型。本部分拉取自 Azure Monitor 支持的所有资源日志类别类型列表。

Microsoft.CognitiveServices/accounts 支持的资源日志

类别	类别显示名称	日志表	支持基本日志计划	支持引入时间转换	导出成本
`Audit`	审核日志	AzureDiagnostics 来自多个 Azure 资源的日志。	否	否	否
`AzureOpenAIRequestUsage`	Azure OpenAI 请求使用情况	AzureDiagnostics 来自多个 Azure 资源的日志。	否	否	是
`RequestResponse`	请求和响应日志	AzureDiagnostics 来自多个 Azure 资源的日志。	否	否	否
`Trace`	跟踪日志	AzureDiagnostics 来自多个 Azure 资源的日志。	否	否	否

Azure Monitor 日志表

本部分列出了与此服务相关的 Azure Monitor 日志表，日志分析可使用 Kusto 查询来查询这些表。这些表包含资源日志数据，此外还可能包含其他数据，具体取决于所收集并路由到这些表的内容。

Azure OpenAI microsoft.cognitiveservices/accounts

AzureActivity
AzureMetrics
AzureDiagnostics

活动日志

链接表列出了可在此服务的活动日志中记录的操作。这些操作是活动日志中所有可能的资源提供程序操作的子集。

有关活动日志条目架构的详细信息，请参阅活动日志架构。

AI + 机器学习资源提供程序作

有关监视 Azure OpenAI 的说明，请参阅 Monitor Azure OpenAI 。
请参阅使用 Azure Monitor 监视 Azure 资源，详细了解如何监视 Azure 资源。

通过