Compartir a través de


Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Encabezados de tabla

Métrica - El nombre de la métrica tal como aparece en el portal de Azure.
Nombre en la REST API: Nombre de métrica como se conoce en la REST API.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Granos Temporales - Intervalos en los que se muestrea la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.

Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Categoría: Recurso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Porcentaje de uso de memoria de CPU

Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto.
CpuMemoryUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Porcentaje de uso de la CPU

Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto.
CpuUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Errores de recopilación de datos por minuto

El número de eventos de recopilación de datos disminuyó por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Promedio instanceId, , reason, type PT1M No
Eventos de recopilación de datos por minuto

Número de eventos de recopilación de datos procesados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Promedio instanceId, type PT1M No
Capacidad de implementación

Número de instancias de la implementación.
DeploymentCapacity Count Mínimo, Máximo, Promedio instanceId, State PT1M No
Utilización de disco

Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto.
DiskUtilization Porcentaje Mínimo, Máximo, Promedio instanceId, disk PT1M
Energía de GPU, en julios

Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto.
GpuEnergyJoules Count Mínimo, Máximo, Promedio instanceId PT1M No
Porcentaje de uso de memoria de GPU

Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuMemoryUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Porcentaje de uso de GPU

Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M

Categoría: Tráfico

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Latencia de las solicitudes P50

La latencia media de las solicitudes P50, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P50 Milisegundos Promedio <ninguno> PT1M
Latencia de las solicitudes P90

Latencia promedio P90 de las solicitudes, agregada a partir de todos los valores de latencia de solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P90 Milisegundos Promedio <ninguno> PT1M
Latencia de las solicitudes P95

Latencia promedio P95 de las solicitudes, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P95 Milisegundos Promedio <ninguno> PT1M
Latencia de las solicitudes P99

Latencia media de las solicitudes de P99 agregada por los valores de latencia de todas las solicitudes recopilados durante el período seleccionado
RequestLatency_P99 Milisegundos Promedio <ninguno> PT1M
Solicitudes por minuto

Número de solicitudes enviadas a la implementación en línea en un minuto
RequestsPerMinute Count Promedio envoy_response_code PT1M No

Pasos siguientes