Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

2025-04-21

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Encabezados de tabla

Métrica - El nombre de la métrica tal como aparece en el portal de Azure.
Nombre en la REST API: Nombre de métrica como se conoce en la REST API.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Granos Temporales - Intervalos en los que se muestrea la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.

Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Categoría: Recurso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Intervalos de agregación	Exportación de DS
Porcentaje de uso de memoria de CPU Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto.	`CpuMemoryUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Porcentaje de uso de la CPU Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto.	`CpuUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Errores de recopilación de datos por minuto El número de eventos de recopilación de datos disminuyó por minuto.	`DataCollectionErrorsPerMinute`	Count	Mínimo, Máximo, Promedio	`instanceId`, , `reason`, `type`	PT1M	No
Eventos de recopilación de datos por minuto Número de eventos de recopilación de datos procesados por minuto.	`DataCollectionEventsPerMinute`	Count	Mínimo, Máximo, Promedio	`instanceId`, `type`	PT1M	No
Capacidad de implementación Número de instancias de la implementación.	`DeploymentCapacity`	Count	Mínimo, Máximo, Promedio	`instanceId`, `State`	PT1M	No
Utilización de disco Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto.	`DiskUtilization`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`, `disk`	PT1M	Sí
Energía de GPU, en julios Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto.	`GpuEnergyJoules`	Count	Mínimo, Máximo, Promedio	`instanceId`	PT1M	No
Porcentaje de uso de memoria de GPU Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto.	`GpuMemoryUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Porcentaje de uso de GPU Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto.	`GpuUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí

Categoría: Tráfico

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Intervalos de agregación	Exportación de DS
Latencia de las solicitudes P50 La latencia media de las solicitudes P50, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P50`	Milisegundos	Promedio	<ninguno>	PT1M	Sí
Latencia de las solicitudes P90 Latencia promedio P90 de las solicitudes, agregada a partir de todos los valores de latencia de solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P90`	Milisegundos	Promedio	<ninguno>	PT1M	Sí
Latencia de las solicitudes P95 Latencia promedio P95 de las solicitudes, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P95`	Milisegundos	Promedio	<ninguno>	PT1M	Sí
Latencia de las solicitudes P99 Latencia media de las solicitudes de P99 agregada por los valores de latencia de todas las solicitudes recopilados durante el período seleccionado	`RequestLatency_P99`	Milisegundos	Promedio	<ninguno>	PT1M	Sí
Solicitudes por minuto Número de solicitudes enviadas a la implementación en línea en un minuto	`RequestsPerMinute`	Count	Promedio	`envoy_response_code`	PT1M	No

Compartir a través de

Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Categoría: Recurso

Categoría: Tráfico

Pasos siguientes

Comentarios

Recursos adicionales