下表列出了可用于 microsoft.kubernetesconfiguration/extensions 资源类型的所有指标。
表标题
指标 - Azure 门户中显示的指标名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度。
时间粒度 - 对指标采样的间隔。 例如,PT1M
表示该指标每分钟采样一次,PT30M
表示每 30 分钟一次,PT1H
表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。
有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。
有关指标保留的信息,请参阅 Azure Monitor 指标概述。
类别:延迟
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
API 请求持续时间(以秒为单位) 请求持续时间直方图 |
ApiRequestDurationSeconds |
秒 | 平均值 | AppName 、、GpuEnabled Method 、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
引入时间 总引入时间(以分钟为单位) |
IngestionTimeMinutes |
秒 | 平均值 | AppName 、GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
输入预处理时间(毫秒) 输入预处理时间(以毫秒为单位) |
InputPreprocessingTimeMilliseconds |
毫秒 | 平均值 | GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
LLM 通话总时间(秒) call_llm 总时间(秒) |
TotalCallLLMTimeSeconds |
秒 | 平均值 | AppName 、、GpuEnabled LLMProvider 、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
嵌入生成总时间(以秒为单位) 从本地模型生成嵌入所需的总时间 |
TotalGenerateEmbeddingsTimeSeconds |
秒 | 平均值 | AppName 、、GpuEnabled InputLength 、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
混合搜索嵌入生成总时间(以秒为单位) 从本地模型生成混合搜索嵌入所用的总时间 |
TotalGenerateHybridSearchEmbeddingsTimeSeconds |
秒 | 平均值 | AppName 、、GpuEnabled InputLength 、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
重新计算生成总时间(以秒为单位) 生成重排序所花费的总时间 |
TotalGenerateRerankingTimeSeconds |
秒 | 平均值 | AppName 、、GpuEnabled InputLength 、、OutputLength |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
获取聊天历史记录摘要总时间(以毫秒为单位) get_chat_history_summary 总时间(毫秒) |
TotalGetChatHistorySummaryTimeMilliseconds |
毫秒 | 平均值 | AppName 、GpuEnabled 、InputHistoryPairs 、LLMProvider 、MaxTokens 、OutputLength 、Temperature 、TopP |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
获取 LLM 有效负载总时间(以毫秒为单位) get_llm_payload 总时间(毫秒) |
TotalGetLLMPayloadTimeMilliseconds |
毫秒 | 平均值 | AppName 、DiversityPenalty 、GpuEnabled 、LengthPenalty 、LLMProvider 、MaxTokens 、RepetitionPenalty 、Temperature 、TopP |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
获取混合搜索总时间(以毫秒为单位) 混合搜索总时间(以毫秒为单位) |
TotalHybridSearchTimeMilliseconds |
毫秒 | 平均值 | AppName 、ChunkMinScore 、GpuEnabled 、IndexType 、InputLength 、MetricType 、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
推理总时间(以秒为单位) 总推理时间(以秒为单位) |
TotalInferenceTimeSeconds |
秒 | 平均值 | AppName 、DiversityPenalty 、GpuEnabled 、InputLength 、LLMProvider 、MaxTokens 、OutputLength 、RepetitionPenalty 、Temperature 、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
区块搜索总时间(以毫秒为单位) 总搜索区块时间(以毫秒为单位) |
TotalSearchChunksTimeMilliseconds |
毫秒 | 平均值 | AppName 、EmbeddingIndexName 、GpuEnabled 、InputLength 、OutputChunks 、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
搜索总时间(以毫秒为单位) 搜索所花费的总时间 |
TotalSearchTimeMilliseconds |
毫秒 | 平均值 | AppName 、ChunkMinScore 、GpuEnabled 、InputLength 、QueryType 、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
相似性搜索总时间(以毫秒为单位) 搜索类似文档所花费的总时间 |
TotalSimilaritySearchTimeMilliseconds |
毫秒 | 平均值 | AppName 、GpuEnabled 、InputLength 、ChunkMinScore 、IndexType 、MetricType 、TopK |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
类别:交通
指标 | REST API 中的名称 | 单位 | 聚合 | 维度 | 时间粒度 | DS 导出 |
---|---|---|---|---|---|---|
活动的 PDU 会话 活动的 PDU 会话数目 |
ActiveSessionCount |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 否 |
API 失败计数 失败 API 请求数量 |
ApiFailureCount |
计数 | 计数 | EndpointName 、 GpuEnabled 、、 StatusCode |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
API 请求计数 API 请求总数 |
ApiRequestCount |
计数 | 计数 | AppName 、、GpuEnabled Method 、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
API 成功计数 成功的 API 请求计数 |
ApiSuccessCount |
计数 | 计数 | EndpointName 、 GpuEnabled 、、 StatusCode |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
身份验证尝试 身份验证尝试速率(每分钟) |
AuthAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
身份验证失败 身份验证失败率(每分钟) |
AuthFailure |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Result |
PT1M | 是 |
身份验证成功 身份验证成功率(每分钟) |
AuthSuccess |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
已连接的 NodeB 已连接的 gNodeB 或 eNodeB 数目 |
ConnectedNodebs |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
取消注册尝试 UE 取消注册尝试速率(每分钟) |
DeRegistrationAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
取消注册成功 UE 取消注册成功率(每分钟) |
DeRegistrationSuccess |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
评估 API 请求计数 评估 API 请求总数 |
EvaluationApiRequestCount |
计数 | 计数 | AppName 、 Method 、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
失败/跳过计数 失败或跳过的文件计数 |
FailedSkippedCount |
计数 | 计数 | Category 、GpuEnabled |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
文件引入速率 每个作业引入的文件总数 |
FileIngestionRate |
计数 | 总计(总和) | AppName 、、GpuEnabled FileType 、、JobID |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
混合搜索模型 API 请求计数 混合搜索模型 API 请求总数 |
HybridSearchModelApiRequestCount |
计数 | 计数 | AppName 、 Method 、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
推理结果反馈 推理答案反馈 |
InferenceAnswerFeedback |
计数 | 计数 | AppName 、ChunkMinScore 、ChunkScores 、GpuEnabled 、LLMProvider 、RunId 、Thumb |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
推理 API 请求计数 推理 API 请求数 |
InferenceApiRequestCount |
计数 | 计数 | AppName 、 Method 、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
引入 API 请求计数 引入 API 请求数 |
IngestionApiRequestCount |
计数 | 计数 | AppName 、 Method 、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
评估次数 评估次数 |
NumberOfEvaluations |
计数 | 计数 | AppName 、、GpuEnabled Method 、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
作业数 作业数 |
NumberOfJobs |
计数 | 计数 | AppName 、、GpuEnabled Method 、、Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
分页尝试 分页尝试速率(每分钟) |
PagingAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
页面故障 分页失败速率(每分钟) |
PagingFailure |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
预配的订阅者 预配的订阅者数 |
ProvisionedSubscribers |
计数 | 总计(总和) | PccpId 、SiteId |
PT1M | 否 |
RAN 安装失败 RAN 安装失败率(每分钟) |
RanSetupFailure |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Cause |
PT1M | 是 |
RAN 安装请求 RAN 设置请求速率(每分钟) |
RanSetupRequest |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
RAN 安装响应 RAN 安装响应率(每分钟) |
RanSetupResponse |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
已注册订阅者 已注册订阅者数 |
RegisteredSubscribers |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
已连接的注册订阅者 已注册和连接的订阅者数 |
RegisteredSubscribersConnected |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
注册的订阅服务器空闲 已注册和空闲订阅者数 |
RegisteredSubscribersIdle |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
注册尝试 注册尝试速率(每分钟) |
RegistrationAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
注册失败 注册失败率(每分钟) |
RegistrationFailure |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Result |
PT1M | 是 |
注册成功 注册成功率(每分钟) |
RegistrationSuccess |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
服务请求尝试次数 服务请求尝试速率(每分钟) |
ServiceRequestAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
服务请求失败 服务请求失败率(每分钟) |
ServiceRequestFailure |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、Result 、Tai |
PT1M | 是 |
服务请求成功 服务请求成功率(每分钟) |
ServiceRequestSuccess |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
会话建立尝试 PDU 会话建立尝试速率(每分钟) |
SessionEstablishmentAttempt |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Dnn |
PT1M | 是 |
会话建立失败 PDU 会话建立失败速率(每分钟) |
SessionEstablishmentFailure |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Dnn |
PT1M | 是 |
会话建立成功 PDU 会话建立成功率(每分钟) |
SessionEstablishmentSuccess |
计数 | 总计(总和) | 3gppGen 、、PccpId SiteId 、、Dnn |
PT1M | 是 |
会话释放 会话释放速率(每分钟) |
SessionRelease |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
UE 上下文释放命令 UE 上下文释放命令消息速率(每分钟) |
UeContextReleaseCommand |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
UE 上下文释放完成 UE 上下文释放完成消息速率(每分钟) |
UeContextReleaseComplete |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
UE 上下文释放请求 UE 上下文释放请求消息速率(每分钟) |
UeContextReleaseRequest |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
用户平面带宽 用户平面带宽(以位/秒为单位)。 |
UserPlaneBandwidth |
比特每秒 | 总计(总和) | PcdpId 、、SiteId Direction 、、Interface |
PT1M | 否 |
用户平面数据包丢弃速率 用户平面数据包丢弃速率(数据包/秒) |
UserPlanePacketDropRate |
每秒计数 | 总计(总和) | PcdpId 、、SiteId Cause 、Direction 、Interface |
PT1M | 否 |
用户平面数据包速率 用户平面数据包速率(数据包数/秒) |
UserPlanePacketRate |
每秒计数 | 总计(总和) | PcdpId 、、SiteId Direction 、、Interface |
PT1M | 否 |
VectorDB API 请求计数 向 VectorDB 发出的 API 请求总数 |
VectorDbApiRequestCount |
计数 | 计数 | AppName 、 Method 、、 Route |
PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H | 否 |
Xn 切换尝试 切换尝试速率(每分钟) |
XnHandoverAttempt |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
Xn 切换失败 切换失败率(每分钟) |
XnHandoverFailure |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |
Xn 切换成功 切换成功率(每分钟) |
XnHandoverSuccess |
计数 | 总计(总和) | 3gppGen 、 PccpId 、、 SiteId |
PT1M | 是 |