Compartir a través de


Métricas admitidas para microsoft.kubernetesconfiguration/extensions

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso microsoft.kubernetesconfiguration/extensions.

Encabezados de tabla

Métrica - El nombre de visualización de la métrica tal como aparece en el portal de Azure.
Nombre en la API REST: Nombre de la métrica tal como se refiere en la API REST.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Granularidad temporal - Intervalos en los que se muestrea la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.

Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Categoría: Latencia

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Duración de la solicitud de API en segundos

Histograma de duraciones de solicitud
ApiRequestDurationSeconds Segundos Promedio AppName, GpuEnabled, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo de ingesta

Tiempo total de ingesta en minutos
IngestionTimeMinutes Segundos Promedio AppName, GpuEnabled PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo de preprocesamiento de entrada (milisegundos)

Tiempo de preprocesamiento de entrada en milisegundos
InputPreprocessingTimeMilliseconds Milisegundos Promedio GpuEnabled PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Llamar al tiempo total de LLM en segundos

Tiempo total de call_llm en segundos
TotalCallLLMTimeSeconds Segundos Promedio AppName, GpuEnabled, , LLMProvider, OutputLength PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Inserción de tiempo total de generación en segundos

Tiempo total necesario para generar incrustaciones a partir del modelo local
TotalGenerateEmbeddingsTimeSeconds Segundos Promedio AppName, GpuEnabled, , InputLength, OutputLength PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo total de generación de inserción de búsqueda híbrida en segundos

Tiempo total necesario para generar incrustaciones de búsqueda híbrida a partir del modelo local
TotalGenerateHybridSearchEmbeddingsTimeSeconds Segundos Promedio AppName, GpuEnabled, , InputLength, OutputLength PT1M (1 minuto), PT5M (5 minutos), PT15M (15 minutos), PT30M (30 minutos), PT1H (1 hora), PT6H (6 horas), PT12H (12 horas) No
Tiempo total de generación de reordenamiento en segundos

Tiempo total necesario para generar la reordenación
TotalGenerateRerankingTimeSeconds Segundos Promedio AppName, GpuEnabled, , InputLength, OutputLength PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Obtener el tiempo total en milisegundos del resumen del historial de chat

Tiempo total de get_chat_history_summary en milisegundos
TotalGetChatHistorySummaryTimeMilliseconds Milisegundos Promedio AppName, GpuEnabled, InputHistoryPairs, LLMProvider, MaxTokens, OutputLength, , TemperatureTopP PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Obtener tiempo total de carga de LLM en milisegundos

Tiempo total de get_llm_payload en milisegundos
TotalGetLLMPayloadTimeMilliseconds Milisegundos Promedio AppName, DiversityPenalty, GpuEnabled, LengthPenalty, LLMProvider, MaxTokens, RepetitionPenalty, TemperatureTopP PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Obtener tiempo total de búsqueda híbrida en milisegundos

Tiempo total de búsqueda híbrida en milisegundos
TotalHybridSearchTimeMilliseconds Milisegundos Promedio AppName, ChunkMinScore, GpuEnabled, IndexType, InputLength, , MetricTypeTopK PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo total de inferencia en segundos

Tiempo total de inferencia en segundos
TotalInferenceTimeSeconds Segundos Promedio AppName, DiversityPenalty, GpuEnabled, InputLength, LLMProvider, MaxTokens, OutputLength, RepetitionPenalty, Temperature, TopK PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo total de búsqueda de fragmentos en milisegundos

Tiempo total de fragmentos de búsqueda en milisegundos
TotalSearchChunksTimeMilliseconds Milisegundos Promedio AppName, EmbeddingIndexName, GpuEnabled, InputLength, , OutputChunks, TopK PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo total de búsqueda en milisegundos

Tiempo total que se tarda en buscar
TotalSearchTimeMilliseconds Milisegundos Promedio AppName, ChunkMinScore, GpuEnabled, InputLength, , QueryType, TopK PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tiempo total de búsqueda de similitud en milisegundos

Tiempo total necesario para buscar documentos similares
TotalSimilaritySearchTimeMilliseconds Milisegundos Promedio AppName, GpuEnabled, InputLength, ChunkMinScore, IndexType, , MetricTypeTopK PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No

Categoría: Tráfico

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Sesiones de PDU activas

Número de sesiones de PDU activas
ActiveSessionCount Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M No
Recuento de errores de API

Recuento de solicitudes de API con error
ApiFailureCount Recuento Recuento EndpointName, , GpuEnabled, StatusCode PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento de solicitudes de API

Número total de solicitudes de API
ApiRequestCount Recuento Recuento AppName, GpuEnabled, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento de éxitos de API

Recuento de solicitudes de API exitosas
ApiSuccessCount Recuento Recuento EndpointName, , GpuEnabled, StatusCode PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Intentos de autenticación

Tasa de intentos de autenticación (por minuto)
AuthAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Errores de autenticación

Tasa de errores de autenticación (por minuto)
AuthFailure Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Result PT1M
Autenticación correcta

Tasa de éxito autenticación (por minuto)
AuthSuccess Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Nodos conectados

Número de gNodeBs o eNodeBs conectados
ConnectedNodebs Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Intentos de desregistración

Tasa de intentos anulación de registros de UE (por minuto)
DeRegistrationAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Éxitos de Cancelación de Registro

Tasa de éxito de cancelación de registro de la UE (por minuto)
DeRegistrationSuccess Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Recuento de solicitudes de API de evaluación

Número total de solicitudes de API de evaluación
EvaluationApiRequestCount Recuento Recuento AppName, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento omitido erróneo

Recuento de archivos con errores o omitidos
FailedSkippedCount Recuento Recuento Category, GpuEnabled PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Tasa de ingesta de archivos

Total de archivos ingeridos por trabajo
FileIngestionRate Recuento Total (Suma) AppName, GpuEnabled, , FileType, JobID PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento de solicitudes de API del modelo de búsqueda híbrida

Número total de solicitudes de API del modelo de búsqueda híbrida
HybridSearchModelApiRequestCount Recuento Recuento AppName, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Retroalimentación de respuesta de inferencia

Comentarios de respuesta de inferencia
InferenceAnswerFeedback Recuento Recuento AppName, ChunkMinScore, ChunkScores, GpuEnabled, LLMProvider, , RunIdThumb PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento de solicitudes de API de inferencia

Número de solicitudes de API de inferencia
InferenceApiRequestCount Recuento Recuento AppName, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Recuento de solicitudes de API de ingesta

Número de solicitudes de API de ingesta
IngestionApiRequestCount Recuento Recuento AppName, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Número de evaluaciones

Número de evaluaciones
NumberOfEvaluations Recuento Recuento AppName, GpuEnabled, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Número de trabajos

Número de trabajos
NumberOfJobs Recuento Recuento AppName, GpuEnabled, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Intentos de paginación

Tasa de intentos de paginación (por minuto)
PagingAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Errores de paginación

Tasa de errores de paginación (por minuto)
PagingFailure Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Suscriptores aprovisionados

Número de suscriptores aprovisionados
ProvisionedSubscribers Recuento Total (Suma) PccpId, SiteId PT1M No
Errores de instalación de RAN

Tasa de errores de instalación de RAN (por minuto)
RanSetupFailure Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Cause PT1M
Solicitudes de instalación de RAN

Tasa de solicitudes de instalación de RAN (por minuto)
RanSetupRequest Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Respuestas de instalación de RAN

Índice de respuesta de instalación de RAN (por minuto)
RanSetupResponse Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Suscriptores registrados

Número de suscriptores registrados
RegisteredSubscribers Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Suscriptores registrados conectados

Número de suscriptores registrados y conectados
RegisteredSubscribersConnected Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Suscriptores registrados inactivos

Número de suscriptores registrados e inactivos
RegisteredSubscribersIdle Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Intentos de registro

Tasa de intentos de registro (por minuto)
RegistrationAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Errores de registro

Tasa de errores de registro (por minuto)
RegistrationFailure Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Result PT1M
Éxitos de registro

Tasa de éxito de registro (por minuto)
RegistrationSuccess Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Intentos de solicitud de servicio

Tasa de intentos de solicitud de servicio (por minuto)
ServiceRequestAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Errores de solicitud de servicio

Tasa de errores de solicitud de servicio (por minuto)
ServiceRequestFailure Recuento Total (Suma) 3gppGen, PccpId, SiteId, , Result, Tai PT1M
Éxitos de solicitudes de servicio

Tasa de éxito de solicitud de servicio (por minuto)
ServiceRequestSuccess Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Intentos de establecimiento de sesión

Tasa de intentos de establecimiento de sesión de PDU (por minuto)
SessionEstablishmentAttempt Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Dnn PT1M
Errores de establecimiento de sesión

Tasa de errores de establecimiento de sesión de PDU (por minuto)
SessionEstablishmentFailure Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Dnn PT1M
Establecimientos de sesión correctos

Porcentaje de éxito en el establecimiento de sesiones PDU (por minuto)
SessionEstablishmentSuccess Recuento Total (Suma) 3gppGen, PccpId, , SiteId, Dnn PT1M
Versiones de sesión

Tasa de versiones de sesión (por minuto)
SessionRelease Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Comandos de versión de contexto de UE

Tasa de mensajes de comandos de versión de contexto de UE (por minuto)
UeContextReleaseCommand Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Versiones de contexto de UE completas

Tasa de mensajes de versiones de contexto de UE completas (por minuto)
UeContextReleaseComplete Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Solicitudes de versión de contexto de UE

Tasa de mensajes de solicitudes de versión de contexto de UE (por minuto)
UeContextReleaseRequest Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Ancho de banda (Bandwidth) del plano de usuario

Ancho de banda del plano del usuario en bits por segundo.
UserPlaneBandwidth Bits por segundo Total (Suma) PcdpId, SiteId, , Direction, Interface PT1M No
Tasa de anulación de paquetes del plano de usuario

Tasa de anulación de paquetes del plano de usuario (paquetes por segundo)
UserPlanePacketDropRate CountPerSecond Total (Suma) PcdpId, SiteId, Cause, , Direction, Interface PT1M No
Tasa de paquetes del plano de usuario

Tasa de paquetes del plano de usuario (paquetes por segundo)
UserPlanePacketRate CountPerSecond Total (Suma) PcdpId, SiteId, , Direction, Interface PT1M No
Recuento de solicitudes de API de VectorDB

Número total de solicitudes de API a VectorDB
VectorDbApiRequestCount Recuento Recuento AppName, , Method, Route PT1M, PT5M, PT15M, PT30M, PT1H, PT6H, PT12H No
Intentos de entrega de Xn

Tasa de intentos de entrega (por minuto)
XnHandoverAttempt Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Errores de entrega de Xn

Tasa de errores de entrega (por minuto)
XnHandoverFailure Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M
Éxitos de entrega de Xn

Tasa de éxito de entrega (por minuto)
XnHandoverSuccess Recuento Total (Suma) 3gppGen, , PccpId, SiteId PT1M

Pasos siguientes