你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文包含此服务的所有监视参考信息。
有关可在 Azure AI Foundry 模型中为 Azure OpenAI 收集的数据以及如何使用它的详细信息,请参阅 Monitor Azure OpenAI 。
指标
本部分列出了为此服务自动收集的所有平台指标。 这些指标也是 Azure Monitor 中支持的所有平台指标的全局列表的一部分。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
Microsoft.CognitiveServices/accounts 支持的指标
下面是我们认为应该监视 Azure OpenAI 的最重要指标。 本文的后面部分是此命名空间的所有可用指标的较长列表,其中包含有关此较短列表中指标的更多详细信息。 有关最新信息,请参阅下面的列表。 我们正在努力刷新以下部分中的表。
- Azure OpenAI 请求
- 有效令牌
- 生成的完成令牌
- 已处理的 FineTuned 训练小时数
- 已处理的推理令牌
- 已处理的提示令牌
- 预配管理的利用率 V2
- 提示令牌缓存匹配率
- 响应时间
- 令牌之间的时间
- 最后一个字节的时间
- 规范化时间到第一个字节
- 每秒令牌数
还可以监视其他相关服务使用的内容安全指标。
- 阻止的卷
- 检测到有害卷
- 潜在的滥用用户计数
- 安全系统事件
- 为安全检查发送的总卷
注意
经过预配和管理的利用率指标现已弃用,不再推荐使用。 此指标已替换为经过预配和管理的利用率 V2 指标。 令牌每秒、响应时间、令牌之间的时间目前不适用于标准部署。
认知服务指标具有认知服务 - 下表中的 HTTP 请求类别。 这些指标是此类型的所有资源通用的旧指标。 Microsoft不再建议将这些指标用于 Azure OpenAI。
下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。
- 并非所有列都显示在每个表中。
- 某些列可能超出了页面的查看区域。 选择“展开表”以查看所有可用列。
表标题
- 类别 - 指标组或分类。
- 指标 - 在 Azure 门户中显示的指标显示名称。
- REST API 中的名称 - 在 REST API 中引用的指标名称。
- 单位 - 度量单位。
- 聚合 - 默认的聚合类型。 有效值:平均值(平均)、最小值(最小值)、最大值(最大值)、总计(总和)、计数。
- 维度 - 适用于指标的维度。
-
时间粒度 - 对指标采样的间隔。 例如,
PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。 - DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。 要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置。
类别:作
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
操作出现次数 每个操作的出现次数。 |
ActionIdOccurrences |
计数 | 总计(总和) |
ActionId 、 Mode 、、 RunId |
PT1M | 是 |
每个事件的操作数量 每个事件的操作数量。 |
ActionsPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
类别:Azure OpenAI - HTTP 请求
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
Azure OpenAI AvailabilityRate 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 |
AzureOpenAIAvailabilityRate |
百分比 | 最小值、最大值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、、 ModelName ModelVersion |
PT1M | 否 |
Azure OpenAI 请求 一段时间内对 Azure OpenAI API 的调用次数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode(成功、客户端程序、服务器错误)、StreamType(流式处理请求和非流式处理请求)和操作。 |
AzureOpenAIRequests |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、ModelName 、、 ModelVersion StatusCode |
PT1M | 是 |
类别:Azure OpenAI - 延迟
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
令牌之间的时间 对于流式处理请求;模型令牌生成速率,以毫秒为单位。 适用于 PTU、PTU 托管的部署和即用即付部署。 |
AzureOpenAINormalizedTBTInMS |
毫秒 | 最大值、最小值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 是 |
规范化时间到第一个字节 对于流式处理和非流式处理请求;通过令牌规范化请求后接收第一字节响应数据所需的时间。 适用于 PTU、PTU 托管和即用即付部署。 |
AzureOpenAINormalizedTTFTInMS |
毫秒 | 最大值、最小值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 是 |
响应时间 对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU、PTU 托管的部署和即用即付部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。 |
AzureOpenAITimeToResponse |
毫秒 | 最小值、最大值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、ModelName 、、 ModelVersion StatusCode |
PT1M | 是 |
每秒令牌数 枚举给定 Azure OpenAI 模型响应的生成速度。 生成的令牌总数除以生成令牌的时间(以秒为单位)。 适用于 PTU、PTU 托管的部署和即用即付部署。 |
AzureOpenAITokenPerSecond |
计数 | 最大值、最小值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 是 |
最后一个字节的时间 对于流式处理和非流式处理请求;在模型发出请求后接收最后一个字节响应数据所需的时间。 适用于 PTU、PTU 托管和即用即付部署。 |
AzureOpenAITTLTInMS |
毫秒 | 最大值、最小值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 是 |
类别:Azure OpenAI - 使用情况
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
有效令牌 令牌总数减去一段时间内缓存的令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率,并将其与方案的目标 TPS 或 TPM 基准进行比较。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 |
ActiveTokens |
计数 | 最小值、最大值、平均值、总计(求和) |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 是 |
音频完成令牌 OpenAI 模型上生成的音频提示令牌数(输出)。 适用于 PTU 托管的即用即付模型部署。 |
AudioCompletionTokens |
计数 | 总计(总和) |
ModelDeploymentName 、、ModelName ModelVersion 、、Region |
PT1M | 是 |
音频提示令牌 OpenAI 模型上处理的音频提示令牌数(输入)。 适用于 PTU 托管的即用即付模型部署。 |
AudioPromptTokens |
计数 | 总计(总和) |
ModelDeploymentName 、、ModelName ModelVersion 、、Region |
PT1M | 是 |
提示令牌缓存匹配率 命中缓存的提示令牌的百分比。 适用于 PTU 和 PTU 托管的部署。 |
AzureOpenAIContextTokensCacheMatchRate |
百分比 | 最小值、最大值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 否 |
预配管理的利用率(已弃用) 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求) |
AzureOpenAIProvisionedManagedUtilization |
百分比 | 最小值、最大值、平均值 |
Region 、、StreamType ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 否 |
预配管理的利用率 V2 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求) |
AzureOpenAIProvisionedManagedUtilizationV2 |
百分比 | 最小值、最大值、平均值 |
Region 、、StreamType ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 否 |
已处理的 FineTuned 训练小时数 在 OpenAI FineTuned 模型中处理的训练小时数 |
FineTunedTrainingHours |
计数 | 总计(总和) |
ApiName 、、ModelDeploymentName FeatureName 、UsageChannel 、Region |
PT1M | 是 |
生成的完成令牌 从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 托管的部署和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
GeneratedTokens |
计数 | 总计(总和) |
ApiName 、、ModelDeploymentName FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
已处理的提示令牌 OpenAI 模型上处理(输入)的提示令牌数。 适用于 PTU、PTU 托管的部署和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
ProcessedPromptTokens |
计数 | 总计(总和) |
ApiName 、、ModelDeploymentName FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
已处理的推理令牌 在 OpenAI 模型上处理的推理令牌数量。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管的部署和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。 |
TokenTransaction |
计数 | 总计(总和) |
ApiName 、、ModelDeploymentName FeatureName 、UsageChannel 、Region 、ModelVersion |
PT1M | 是 |
类别:认知服务 - HTTP 请求
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
阻止的调用数 超过速率或配额限制的调用数。 请勿用于 Azure OpenAI 服务。 |
BlockedCalls |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
客户端错误数 引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿用于 Azure OpenAI 服务。 |
ClientErrors |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
数据输入 传入数据的大小(字节)。 请勿用于 Azure OpenAI 服务。 |
DataIn |
字节 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
数据输出 传出数据的大小(字节)。 请勿用于 Azure OpenAI 服务。 |
DataOut |
字节 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
延迟 延迟(毫秒)。 请勿用于 Azure OpenAI 服务。 |
Latency |
毫秒 | 平均值 |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
Ratelimit ratelimit 键的当前速率限制。 请勿用于 Azure OpenAI 服务。 |
Ratelimit |
计数 | 总计(总和) |
Region 、RatelimitKey |
PT1M | 是 |
服务器错误数 引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿用于 Azure OpenAI 服务。 |
ServerErrors |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
成功调用数 成功调用数。 请勿用于 Azure OpenAI 服务。 |
SuccessfulCalls |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
呼叫总数 调用总数。 请勿用于 Azure OpenAI 服务。 |
TotalCalls |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
错误总数 引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿用于 Azure OpenAI 服务。 |
TotalErrors |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 是 |
令牌调用总数 令牌调用的总数。 |
TotalTokenCalls |
计数 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
类别:认知服务 - SLI
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
AvailabilityRate 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿用于 Azure OpenAI 服务。 |
SuccessRate |
百分比 | 最小值、最大值、平均值 |
ApiName 、、OperationName Region 、、RatelimitKey |
PT1M | 否 |
类别:ContentSafety - 风险&安全
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
潜在的滥用用户计数 在一段时间内检测到的潜在滥用用户数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName。 |
RAIAbusiveUsersCount |
计数 | 总计(总和) |
Region 、ModelDeploymentName |
PT1M | 是 |
检测到有害卷 一段时间内应用的内容筛选器对 Azure OpenAI API 进行的并检测为有害(块模型和注释模式)的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。 |
RAIHarmfulRequests |
计数 | 总计(总和) |
Region 、、ModelDeploymentName ModelName 、ModelVersion 、ApiName 、TextType 、、 Category Severity |
PT1M | 是 |
阻止的卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。 |
RAIRejectedRequests |
计数 | 总计(总和) |
Region 、、ModelDeploymentName ModelName 、ModelVersion 、ApiName 、、 TextType Category |
PT1M | 是 |
安全系统事件 用于风险与安全监视的系统事件。 可以添加筛选器或按以下维度应用拆分:EventType。 |
RAISystemEvent |
计数 | 平均值 |
Region 、EventType |
PT1M | 是 |
为安全检查发送的总卷 在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器检测的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName。 |
RAITotalRequests |
计数 | 总计(总和) |
Region 、、ModelDeploymentName ModelName 、ModelVersion 、ApiName |
PT1M | 是 |
类别:ContentSafety - 用法
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
用于图像审查的调用计数 用于图像审查的调用数。 |
ContentSafetyImageAnalyzeRequestCount |
计数 | 总计(总和) | ApiVersion |
PT1M | 是 |
用于文本审查的调用计数 用于文本审查的调用数。 |
ContentSafetyTextAnalyzeRequestCount |
计数 | 总计(总和) | ApiVersion |
PT1M | 是 |
类别:估计
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
基线随机事件计数 基线随机事件计数的估算值。 |
BaselineRandomEventCount |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
基线随机奖励 基线随机奖励的估算值。 |
BaselineRandomReward |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
联机事件计数 联机事件计数的估算值。 |
OnlineEventCount |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
联机奖励 联机奖励的估算值。 |
OnlineReward |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
用户基线事件计数 用户定义的基线事件计数的估算值。 |
UserBaselineEventCount |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
用户基线奖励 用户定义的基线奖励的估算值。 |
UserBaselineReward |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
类别:功能发生
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
操作特征出现次数 每个操作特征的出现次数。 |
ActionFeatureIdOccurrences |
计数 | 总计(总和) |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
上下文特征出现次数 每个上下文特征的出现次数。 |
ContextFeatureIdOccurrences |
计数 | 总计(总和) |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
槽特征出现次数 每个槽特征的出现次数。 |
SlotFeatureIdOccurrences |
计数 | 总计(总和) |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
类别:FeatureCardinality
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
按操作列出的特征基数 基于操作的特征基数。 |
FeatureCardinality_Action |
计数 | 平均值 |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
按上下文列出的特征基数 基于上下文的特征基数。 |
FeatureCardinality_Context |
计数 | 平均值 |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
按槽列出的特征基数 基于槽的特征基数。 |
FeatureCardinality_Slot |
计数 | 平均值 |
FeatureId 、 Mode 、、 RunId |
PT1M | 是 |
类别:每个事件的功能
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
每个事件的操作特征数 每个事件的平均操作特征数量。 |
ActionFeaturesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
每个事件的上下文特征数 每个事件的上下文特征数量。 |
ContextFeaturesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
每个事件的槽特征数 每个事件的平均槽特征数量。 |
SlotFeaturesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
类别:语言 - 作业
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
作业工期(预览版) 注意:此值在很大程度上取决于输入大小、文档数量和任务的复杂性。 这是所有作业任务的聚合值。 |
JobDuration |
毫秒 | 最小值、最大值、平均值 |
JobStatus 、JobType |
PT1M | 是 |
类别:模型 - HTTP 请求
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
模型可用性率 使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 |
ModelAvailabilityRate |
百分比 | 最小值、最大值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 否 |
模型请求 在一段时间内对模型 API 进行的调用数。 适用于 PTU、PTU 托管和即用即付部署。 |
ModelRequests |
计数 | 总计(总和) |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、ModelName 、、 ModelVersion StatusCode |
PT1M | 是 |
类别:模型 - 延迟
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
令牌之间的时间 对于流式处理请求;模型令牌生成速率,以毫秒为单位。 适用于 PTU 和 PTU 托管的部署。 |
NormalizedTimeBetweenTokens |
毫秒 | 最大值、最小值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、、 ModelName ModelVersion |
PT1M | 是 |
规范化时间到第一个字节 对于流式处理和非流式处理请求;通过令牌规范化请求后接收第一字节响应数据所需的时间。 适用于 PTU、PTU 托管和即用即付部署。 |
NormalizedTimeToFirstToken |
毫秒 | 最大值、最小值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、、 ModelName ModelVersion |
PT1M | 是 |
最后一个字节的时间 对于流式处理和非流式处理请求;在模型发出请求后接收最后一个字节响应数据所需的时间。 适用于 PTU、PTU 托管和即用即付部署。 |
TimeToLastByte |
毫秒 | 最大值、最小值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、、 ModelName ModelVersion |
PT1M | 是 |
响应时间 对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU 和 PTU 托管的部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。 注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。 |
TimeToResponse |
毫秒 | 最小值、最大值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、ModelName 、、 ModelVersion StatusCode |
PT1M | 是 |
每秒令牌数 枚举给定模型响应的生成速度。 生成的令牌总数除以生成令牌的时间(以秒为单位)。 适用于 PTU 和 PTU 托管的部署。 |
TokensPerSecond |
计数 | 最大值、最小值、平均值 |
ApiName 、、OperationName Region 、StreamType 、ModelDeploymentName 、、 ModelName ModelVersion |
PT1M | 是 |
类别:模型 - 使用情况
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
输入标记 在模型上处理(输入)的提示标记数量。 适用于 PTU、PTU 托管和即用即付部署。 |
InputTokens |
计数 | 总计(总和) |
ApiName 、、Region ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 是 |
输出令牌 从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 托管和即用即付部署。 |
OutputTokens |
计数 | 总计(总和) |
ApiName 、、Region ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 是 |
预配利用率 预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 |
ProvisionedUtilization |
百分比 | 最小值、最大值、平均值 |
Region 、、ModelDeploymentName ModelName 、、ModelVersion |
PT1M | 否 |
令牌总数 在模型上处理的推理令牌数。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管和即用即付部署。 |
TotalTokens |
计数 | 总计(总和) |
ApiName 、、Region ModelDeploymentName 、ModelName 、ModelVersion |
PT1M | 是 |
类别:每个事件的命名空间
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
每个事件的操作命名空间数 每个事件的平均操作命名空间数量。 |
ActionNamespacesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
每个事件的上下文命名空间数 每个事件的上下文命名空间数量。 |
ContextNamespacesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
每个事件的槽命名空间数 每个事件的平均槽命名空间数量。 |
SlotNamespacesPerEvent |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
类别:奖励
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
每个事件的平均奖励 每个事件的平均奖励。 |
Reward |
计数 | 平均值 |
BaselineAction 、、ChosenActionId MatchesBaseline 、NonDefaultReward 、Mode 、RunId |
PT1M | 是 |
槽奖励 每个槽的奖励。 |
SlotReward |
计数 | 平均值 |
BaselineActionId 、、ChosenActionId MatchesBaseline 、NonDefaultReward 、SlotId 、SlotIndex 、、 Mode RunId |
PT1M | 是 |
类别:槽
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
基线估算器总奖励 基线估算器总奖励。 |
BaselineEstimatorOverallReward |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
基线估算器槽奖励 按槽列出的基线估算器奖励。 |
BaselineEstimatorSlotReward |
计数 | 平均值 |
SlotId 、、SlotIndex Mode 、、RunId |
PT1M | 是 |
基线随机估算器总奖励 基线随机估算器总奖励。 |
BaselineRandomEstimatorOverallReward |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
基线随机估算器槽奖励 按槽列出的基线随机估算器奖励。 |
BaselineRandomEstimatorSlotReward |
计数 | 平均值 |
SlotId 、、SlotIndex Mode 、、RunId |
PT1M | 是 |
槽 每个事件的槽数。 |
NumberOfSlots |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
联机估算器总奖励 联机估算器总奖励。 |
OnlineEstimatorOverallReward |
计数 | 平均值 |
Mode 、RunId |
PT1M | 是 |
联机估算器槽奖励 按槽列出的联机估算器奖励。 |
OnlineEstimatorSlotReward |
计数 | 平均值 |
SlotId 、、SlotIndex Mode 、、RunId |
PT1M | 是 |
槽出现次数 每个槽的出现次数。 |
SlotIdOccurrences |
计数 | 总计(总和) |
SlotId 、、SlotIndex Mode 、、RunId |
PT1M | 是 |
类别:SpeechServices - 用法
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
转录的音频秒数 转录的秒数 |
AudioSecondsTranscribed |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
转换的音频秒数 转换的秒数 |
AudioSecondsTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
虚拟形象模型托管秒数 秒数。 |
AvatarModelHostingSeconds |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
虚拟形象模型训练秒 秒数。 |
AvatarModelTrainingSeconds |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
说话人配置文件数 注册的说话人配置文件数。 每小时按比例计算。 |
NumberofSpeakerProfiles |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
说话人辨识事务 说话人辨识事务数 |
SpeakerRecognitionTransactions |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
语音模型托管时间 语音模型托管时间数 |
SpeechModelHostingHours |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
合成字符数 字符数。 |
SynthesizedCharacters |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
合成视频秒数 合成的秒数 |
VideoSecondsSynthesized |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
语音模型托管小时数 小时数。 |
VoiceModelHostingHours |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
语音模型训练分钟数 分钟数。 |
VoiceModelTrainingMinutes |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
类别:使用情况
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
推理计数 Carnegie Frontdoor 服务的推理计数 |
CarnegieInferenceCount |
计数 | 总计(总和) |
Region 、、Modality Category 、Language 、SeverityLevel 、UseCustomList |
PT1M | 是 |
训练的字符数(已弃用) 训练的字符总数。 |
CharactersTrained |
计数 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
转换的字符数(已弃用) 传入的文本请求中的字符总数。 |
CharactersTranslated |
计数 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
计算机视觉事务 计算机视觉事务数 |
ComputerVisionTransactions |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
自定义视觉训练时间 自定义视觉训练时间 |
CustomVisionTrainingTime |
秒 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
自定义视觉事务 自定义视觉预测事务数 |
CustomVisionTransactions |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
转换的文档字符数 文档翻译请求中的字符数。 |
DocumentCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
转换的文档自定义字符数 自定义文档翻译请求中的字符数。 |
DocumentCustomCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
训练的人脸图像 训练的图像数。 每个事务训练 1,000 个图像。 |
FaceImagesTrained |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
存储的人脸 存储的人脸数,每日按比例计算。 每日报告存储的人脸数。 |
FacesStored |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
人脸事务 对人脸服务进行 API 调用的数量 |
FaceTransactions |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
存储的图像 存储的自定义视觉图像数。 |
ImagesStored |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
已了解的事件数 已了解的事件数。 |
LearnedEvents |
计数 | 总计(总和) |
IsMatchBaseline 、 Mode 、、 RunId |
PT1M | 是 |
LUIS 语音请求 LUIS 语音转意向理解请求数 |
LUISSpeechRequests |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
LUIS 文本请求 LUIS 文本请求数 |
LUISTextRequests |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
匹配的奖励数 匹配的奖励数。 |
MatchedRewards |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
未激活的事件数 跳过的事件数量。 |
NonActivatedEvents |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
观察到的奖励数 观察到的奖励数。 |
ObservedRewards |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
转换的同步字符数 文档翻译(同步)请求中的字符数。 |
OneDocumentCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
已翻译文档同步自定义字符 自定义文档翻译(同步)请求中的字符数。 |
OneDocumentCustomCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
已处理的字符数 沉浸式阅读器处理的字符数。 |
ProcessedCharacters |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
处理的运行状况文本记录 处理的运行状况文本记录数 |
ProcessedHealthTextRecords |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
已处理的图像 处理的图像数 |
ProcessedImages |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
处理的页面 处理的页面数 |
ProcessedPages |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
已处理的文本记录数 文本记录的计数。 |
ProcessedTextRecords |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
QA 文本记录 处理的文本记录数 |
QuestionAnsweringTextRecords |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
语音会话持续时间(已弃用) 语音会话的总持续时间(以秒计)。 |
SpeechSessionDuration |
秒 | 总计(总和) |
ApiName 、 OperationName 、、 Region |
PT1M | 是 |
转换的文本字符数 传入的文本翻译请求中的字符数。 |
TextCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
转换的文本自定义字符数 传入的自定义文本翻译请求中的字符数。 |
TextCustomCharactersTranslated |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
训练的文本字符数 使用文本翻译训练的字符数。 |
TextTrainedCharacters |
计数 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
事件总数 事件数量。 |
TotalEvents |
计数 | 总计(总和) |
Mode 、RunId |
PT1M | 是 |
总事务(已弃用) 事务总数。 |
TotalTransactions |
计数 | 总计(总和) | <无> | PT1M | 是 |
翻译专业应用秒 翻译专业应用使用情况的秒数。 |
TranslatorProAppSeconds |
秒 | 总计(总和) |
ApiName 、、FeatureName UsageChannel 、、Region |
PT1M | 是 |
指标维度
有关指标维度定义的信息,请参阅多维指标。
此服务具有以下与其指标关联的维度。
- ApiName
- 功能名称
- ModelDeploymentName
- 模型名
- ModelVersion
- 操作名称
- 区域
- 状态码
- StreamType
- UsageChannel
资源日志
本部分列出了可为此服务收集的资源日志类型。 本部分拉取自 Azure Monitor 支持的所有资源日志类别类型列表。
Microsoft.CognitiveServices/accounts 支持的资源日志
类别 | 类别显示名称 | 日志表 | 支持基本日志计划 | 支持引入时间转换 | 示例查询 | 导出成本 |
---|---|---|---|---|---|---|
Audit |
审核日志 | AzureDiagnostics 来自多个 Azure 资源的日志。 |
否 | 否 | 否 | |
AzureOpenAIRequestUsage |
Azure OpenAI 请求使用情况 | AzureDiagnostics 来自多个 Azure 资源的日志。 |
否 | 否 | 是 | |
RequestResponse |
请求和响应日志 | AzureDiagnostics 来自多个 Azure 资源的日志。 |
否 | 否 | 否 | |
Trace |
跟踪日志 | AzureDiagnostics 来自多个 Azure 资源的日志。 |
否 | 否 | 否 |
Azure Monitor 日志表
本部分列出了与此服务相关的 Azure Monitor 日志表,日志分析可使用 Kusto 查询来查询这些表。 这些表包含资源日志数据,此外还可能包含其他数据,具体取决于所收集并路由到这些表的内容。
Azure OpenAI microsoft.cognitiveservices/accounts
- AzureActivity
- AzureMetrics
- AzureDiagnostics
活动日志
链接表列出了可在此服务的活动日志中记录的操作。 这些操作是活动日志中所有可能的资源提供程序操作的子集。
有关活动日志条目架构的详细信息,请参阅活动日志架构。
相关内容
- 有关监视 Azure OpenAI 的说明,请参阅 Monitor Azure OpenAI 。
- 请参阅使用 Azure Monitor 监视 Azure 资源,详细了解如何监视 Azure 资源。