Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Encabezados de tabla
Métrica - El nombre de la métrica tal como aparece en el portal de Azure.
Nombre en la REST API: Nombre de métrica como se conoce en la REST API.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Granos Temporales - Intervalos en los que se muestrea la métrica. Por ejemplo, PT1M
indica que la métrica se muestrea cada minuto, PT30M
cada 30 minutos, PT1H
cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.
Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.
Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.
Categoría: Recurso
Métrica | Nombre en la API de REST | Unidad | Agregación | Dimensiones | Intervalos de agregación | Exportación de DS |
---|---|---|---|---|---|---|
Porcentaje de uso de memoria de CPU Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto. |
CpuMemoryUtilizationPercentage |
Porcentaje | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Porcentaje de uso de la CPU Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto. |
CpuUtilizationPercentage |
Porcentaje | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Errores de recopilación de datos por minuto El número de eventos de recopilación de datos disminuyó por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Promedio | instanceId , , reason , type |
PT1M | No |
Eventos de recopilación de datos por minuto Número de eventos de recopilación de datos procesados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Promedio | instanceId , type |
PT1M | No |
Capacidad de implementación Número de instancias de la implementación. |
DeploymentCapacity |
Count | Mínimo, Máximo, Promedio | instanceId , State |
PT1M | No |
Utilización de disco Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto. |
DiskUtilization |
Porcentaje | Mínimo, Máximo, Promedio | instanceId , disk |
PT1M | Sí |
Energía de GPU, en julios Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto. |
GpuEnergyJoules |
Count | Mínimo, Máximo, Promedio | instanceId |
PT1M | No |
Porcentaje de uso de memoria de GPU Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto. |
GpuMemoryUtilizationPercentage |
Porcentaje | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Porcentaje de uso de GPU Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto. |
GpuUtilizationPercentage |
Porcentaje | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Categoría: Tráfico
Métrica | Nombre en la API de REST | Unidad | Agregación | Dimensiones | Intervalos de agregación | Exportación de DS |
---|---|---|---|---|---|---|
Latencia de las solicitudes P50 La latencia media de las solicitudes P50, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P50 |
Milisegundos | Promedio | <ninguno> | PT1M | Sí |
Latencia de las solicitudes P90 Latencia promedio P90 de las solicitudes, agregada a partir de todos los valores de latencia de solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P90 |
Milisegundos | Promedio | <ninguno> | PT1M | Sí |
Latencia de las solicitudes P95 Latencia promedio P95 de las solicitudes, calculada a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P95 |
Milisegundos | Promedio | <ninguno> | PT1M | Sí |
Latencia de las solicitudes P99 Latencia media de las solicitudes de P99 agregada por los valores de latencia de todas las solicitudes recopilados durante el período seleccionado |
RequestLatency_P99 |
Milisegundos | Promedio | <ninguno> | PT1M | Sí |
Solicitudes por minuto Número de solicitudes enviadas a la implementación en línea en un minuto |
RequestsPerMinute |
Count | Promedio | envoy_response_code |
PT1M | No |