microsoft.kubernetesconfiguration/extensions 受支持的指标

下表列出了可用于 microsoft.kubernetesconfiguration/extensions 资源类型的所有指标。

表标题

指标 - Azure 门户中显示的指标名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。

有关指标保留的信息,请参阅 Azure Monitor 指标概述

类别:延迟

指标 REST API 中的名称 单位 聚合 维度 时间粒度 DS 导出
API 请求持续时间(以秒为单位)

请求持续时间直方图
ApiRequestDurationSeconds 平均值 AppName、、GpuEnabledMethod、、Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
引入时间

总引入时间(以分钟为单位)
IngestionTimeMinutes 平均值 AppNameGpuEnabled PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
输入预处理时间(毫秒)

输入预处理时间(以毫秒为单位)
InputPreprocessingTimeMilliseconds 毫秒 平均值 GpuEnabled PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
LLM 通话总时间(秒)

call_llm 总时间(秒)
TotalCallLLMTimeSeconds 平均值 AppName、、GpuEnabledLLMProvider、、OutputLength PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
嵌入生成总时间(以秒为单位)

从本地模型生成嵌入所需的总时间
TotalGenerateEmbeddingsTimeSeconds 平均值 AppName、、GpuEnabledInputLength、、OutputLength PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
混合搜索嵌入生成总时间(以秒为单位)

从本地模型生成混合搜索嵌入所用的总时间
TotalGenerateHybridSearchEmbeddingsTimeSeconds 平均值 AppName、、GpuEnabledInputLength、、OutputLength PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
重新计算生成总时间(以秒为单位)

生成重排序所花费的总时间
TotalGenerateRerankingTimeSeconds 平均值 AppName、、GpuEnabledInputLength、、OutputLength PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
获取聊天历史记录摘要总时间(以毫秒为单位)

get_chat_history_summary 总时间(毫秒)
TotalGetChatHistorySummaryTimeMilliseconds 毫秒 平均值 AppNameGpuEnabledInputHistoryPairsLLMProviderMaxTokensOutputLengthTemperatureTopP PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
获取 LLM 有效负载总时间(以毫秒为单位)

get_llm_payload 总时间(毫秒)
TotalGetLLMPayloadTimeMilliseconds 毫秒 平均值 AppNameDiversityPenaltyGpuEnabledLengthPenaltyLLMProviderMaxTokensRepetitionPenaltyTemperatureTopP PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
获取混合搜索总时间(以毫秒为单位)

混合搜索总时间(以毫秒为单位)
TotalHybridSearchTimeMilliseconds 毫秒 平均值 AppNameChunkMinScoreGpuEnabledIndexTypeInputLengthMetricTypeTopK PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
推理总时间(以秒为单位)

总推理时间(以秒为单位)
TotalInferenceTimeSeconds 平均值 AppNameDiversityPenaltyGpuEnabledInputLengthLLMProviderMaxTokensOutputLengthRepetitionPenaltyTemperatureTopK PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
区块搜索总时间(以毫秒为单位)

总搜索区块时间(以毫秒为单位)
TotalSearchChunksTimeMilliseconds 毫秒 平均值 AppNameEmbeddingIndexNameGpuEnabledInputLengthOutputChunksTopK PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
搜索总时间(以毫秒为单位)

搜索所花费的总时间
TotalSearchTimeMilliseconds 毫秒 平均值 AppNameChunkMinScoreGpuEnabledInputLengthQueryTypeTopK PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
相似性搜索总时间(以毫秒为单位)

搜索类似文档所花费的总时间
TotalSimilaritySearchTimeMilliseconds 毫秒 平均值 AppNameGpuEnabledInputLengthChunkMinScoreIndexTypeMetricTypeTopK PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H

类别:交通

指标 REST API 中的名称 单位 聚合 维度 时间粒度 DS 导出
活动的 PDU 会话

活动的 PDU 会话数目
ActiveSessionCount 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
API 失败计数

失败 API 请求数量
ApiFailureCount 计数 计数 EndpointNameGpuEnabled、、 StatusCode PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
API 请求计数

API 请求总数
ApiRequestCount 计数 计数 AppName、、GpuEnabledMethod、、Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
API 成功计数

成功的 API 请求计数
ApiSuccessCount 计数 计数 EndpointNameGpuEnabled、、 StatusCode PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
身份验证尝试

身份验证尝试速率(每分钟)
AuthAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
身份验证失败

身份验证失败率(每分钟)
AuthFailure 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Result PT1M
身份验证成功

身份验证成功率(每分钟)
AuthSuccess 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
已连接的 NodeB

已连接的 gNodeB 或 eNodeB 数目
ConnectedNodebs 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
取消注册尝试

UE 取消注册尝试速率(每分钟)
DeRegistrationAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
取消注册成功

UE 取消注册成功率(每分钟)
DeRegistrationSuccess 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
评估 API 请求计数

评估 API 请求总数
EvaluationApiRequestCount 计数 计数 AppNameMethod、、 Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
失败/跳过计数

失败或跳过的文件计数
FailedSkippedCount 计数 计数 CategoryGpuEnabled PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
文件引入速率

每个作业引入的文件总数
FileIngestionRate 计数 总计(总和) AppName、、GpuEnabledFileType、、JobID PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
混合搜索模型 API 请求计数

混合搜索模型 API 请求总数
HybridSearchModelApiRequestCount 计数 计数 AppNameMethod、、 Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
推理结果反馈

推理答案反馈
InferenceAnswerFeedback 计数 计数 AppNameChunkMinScoreChunkScoresGpuEnabledLLMProviderRunIdThumb PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
推理 API 请求计数

推理 API 请求数
InferenceApiRequestCount 计数 计数 AppNameMethod、、 Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
引入 API 请求计数

引入 API 请求数
IngestionApiRequestCount 计数 计数 AppNameMethod、、 Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
评估次数

评估次数
NumberOfEvaluations 计数 计数 AppName、、GpuEnabledMethod、、Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
作业数

作业数
NumberOfJobs 计数 计数 AppName、、GpuEnabledMethod、、Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
分页尝试

分页尝试速率(每分钟)
PagingAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
页面故障

分页失败速率(每分钟)
PagingFailure 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
预配的订阅者

预配的订阅者数
ProvisionedSubscribers 计数 总计(总和) PccpIdSiteId PT1M
RAN 安装失败

RAN 安装失败率(每分钟)
RanSetupFailure 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Cause PT1M
RAN 安装请求

RAN 设置请求速率(每分钟)
RanSetupRequest 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
RAN 安装响应

RAN 安装响应率(每分钟)
RanSetupResponse 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
已注册订阅者

已注册订阅者数
RegisteredSubscribers 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
已连接的注册订阅者

已注册和连接的订阅者数
RegisteredSubscribersConnected 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
注册的订阅服务器空闲

已注册和空闲订阅者数
RegisteredSubscribersIdle 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
注册尝试

注册尝试速率(每分钟)
RegistrationAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
注册失败

注册失败率(每分钟)
RegistrationFailure 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Result PT1M
注册成功

注册成功率(每分钟)
RegistrationSuccess 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
服务请求尝试次数

服务请求尝试速率(每分钟)
ServiceRequestAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
服务请求失败

服务请求失败率(每分钟)
ServiceRequestFailure 计数 总计(总和) 3gppGen、、PccpIdSiteIdResultTai PT1M
服务请求成功

服务请求成功率(每分钟)
ServiceRequestSuccess 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
会话建立尝试

PDU 会话建立尝试速率(每分钟)
SessionEstablishmentAttempt 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Dnn PT1M
会话建立失败

PDU 会话建立失败速率(每分钟)
SessionEstablishmentFailure 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Dnn PT1M
会话建立成功

PDU 会话建立成功率(每分钟)
SessionEstablishmentSuccess 计数 总计(总和) 3gppGen、、PccpIdSiteId、、Dnn PT1M
会话释放

会话释放速率(每分钟)
SessionRelease 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
UE 上下文释放命令

UE 上下文释放命令消息速率(每分钟)
UeContextReleaseCommand 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
UE 上下文释放完成

UE 上下文释放完成消息速率(每分钟)
UeContextReleaseComplete 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
UE 上下文释放请求

UE 上下文释放请求消息速率(每分钟)
UeContextReleaseRequest 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
用户平面带宽

用户平面带宽(以位/秒为单位)。
UserPlaneBandwidth 比特每秒 总计(总和) PcdpId、、SiteIdDirection、、Interface PT1M
用户平面数据包丢弃速率

用户平面数据包丢弃速率(数据包/秒)
UserPlanePacketDropRate 每秒计数 总计(总和) PcdpId、、SiteIdCauseDirectionInterface PT1M
用户平面数据包速率

用户平面数据包速率(数据包数/秒)
UserPlanePacketRate 每秒计数 总计(总和) PcdpId、、SiteIdDirection、、Interface PT1M
VectorDB API 请求计数

向 VectorDB 发出的 API 请求总数
VectorDbApiRequestCount 计数 计数 AppNameMethod、、 Route PT1M、PT5M、PT15M、PT30M、PT1H、PT6H、PT12H
Xn 切换尝试

切换尝试速率(每分钟)
XnHandoverAttempt 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
Xn 切换失败

切换失败率(每分钟)
XnHandoverFailure 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M
Xn 切换成功

切换成功率(每分钟)
XnHandoverSuccess 计数 总计(总和) 3gppGenPccpId、、 SiteId PT1M

后续步骤