Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 支持的指标

下表列出了可用于 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 资源类型的指标。

表标题

指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。

有关指标保留的信息,请参阅 Azure Monitor 指标概述

类别:资源

指标 REST API 中的名称 单位 聚合 维度 时间粒度 DS 导出
CPU 内存利用率百分比

实例上的内存利用率百分比。 利用率每分钟报告一次。
CpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
CPU 利用率百分比

实例上的 CPU 利用率百分比。 利用率每分钟报告一次。
CpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
每分钟数据收集错误数

每分钟的数据收集事件数量减少。
DataCollectionErrorsPerMinute 计数 最小值、最大值、平均值 instanceIdreason、、 type PT1M
每分钟数据收集事件数

每分钟处理的数据收集事件数。
DataCollectionEventsPerMinute 计数 最小值、最大值、平均值 instanceIdtype PT1M
部署容量

部署中的实例数。
DeploymentCapacity 计数 最小值、最大值、平均值 instanceIdState PT1M
磁盘利用率

实例上的磁盘利用率百分比。 利用率每分钟报告一次。
DiskUtilization 百分比 最小值、最大值、平均值 instanceIddisk PT1M
GPU 能量(焦耳)

GPU 节点上的间隔功耗(焦耳)。 功耗每分钟报告一次。
GpuEnergyJoules 计数 最小值、最大值、平均值 instanceId PT1M
GPU 内存利用率百分比

实例上的 GPU 内存利用率百分比。 利用率每分钟报告一次。
GpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M
GPU 利用率百分比

实例上的 GPU 利用率百分比。 利用率每分钟报告一次。
GpuUtilizationPercentage 百分比 最小值、最大值、平均值 instanceId PT1M

类别:交通

指标 REST API 中的名称 单位 聚合 维度 时间粒度 DS 导出
请求延迟 P50

按所选时间段内收集的所有请求延迟值聚合的平均 P50 请求延迟
RequestLatency_P50 毫秒 平均值 <无> PT1M
请求延迟 P90

按所选时间段内收集的所有请求延迟值聚合的平均 P90 请求延迟
RequestLatency_P90 毫秒 平均值 <无> PT1M
请求延迟 P95

按所选时间段内收集的所有请求延迟值聚合的平均 P95 请求延迟
RequestLatency_P95 毫秒 平均值 <无> PT1M
请求延迟 P99

按所选时间段内收集的所有请求延迟值聚合的平均 P99 请求延迟
RequestLatency_P99 毫秒 平均值 <无> PT1M
每分钟请求数

一分钟内发送到联机部署的请求数
RequestsPerMinute 计数 平均值 envoy_response_code PT1M

后续步骤