容器洞察从 Azure Kubernetes 服务 (AKS) 以及启用 Azure Arc 的 Kubernetes 群集节点和 Pod 收集自定义指标。 使用自定义指标,可以:
- 在性能图表中及时提供聚合计算(平均值、计数、最大值、最小值、总和)。
- 将性能图表固定在 Azure 门户仪表板中。
- 利用指标警报。
重要
自 2024 年 5 月 31 日起,不再收集这些指标,这与容器见解建议的警报(自定义指标)(预览版)退役日期提前至 2024 年 5 月 31 日中的说明一致。 请参阅启用 Prometheus 和 Grafana,以收集 Prometheus 指标。
使用自定义指标
可以使用与从其他数据源(包括指标资源管理器和指标警报)收集的自定义指标相同的方法访问容器见解收集的自定义指标。
收集的指标
以下部分介绍为群集收集的指标值。
节点指标
命名空间:Insights.container/nodes
维度:host
度量 | 说明 |
---|---|
CPU使用毫核数 | 按主机列出的 CPU 使用量,以毫核为单位。 |
cpuUsagePercentage、cpuUsageAllocatablePercentage(预览) | CPU 使用率百分比,分别按节点和可分配情况计算。 |
memoryRssBytes | 按主机列出的内存 RSS 使用量,以字节为单位。 |
memoryRssPercentage、memoryRssAllocatablePercentage(预览) | 各主机和可分配部分的内存 RSS 使用率百分比。 |
内存工作集字节数 | 按主机列出的内存工作集使用量,以字节为单位。 |
memoryWorkingSetPercentage、memoryRssAllocatablePercentage(预览) | 主机和可分配内存的工作集使用率百分比。 |
节点计数 | 按状态分类的节点计数。 |
磁盘使用百分比 | 节点上使用的磁盘百分比,按设备列出。 |
Pod 性能指标
命名空间:Insights.container/pods
维度:controllerName
, Kubernetes namespace
度量 | 说明 |
---|---|
podCount | 按控制器、命名空间、节点和阶段统计的 Pod 数量。 |
已完成作业计数 | 按控制器和 Kubernetes 命名空间,计算超过用户可配置阈值(默认为 6 小时)的已完成作业数量。 |
重启容器计数 | 按控制器和 Kubernetes 命名空间列出的容器重启次数。 |
OOM杀掉容器计数 | 按控制器和 Kubernetes 命名空间列出的 OOM 终止容器计数。 |
Pod就绪百分比 | 按控制器和 Kubernetes 命名空间列出的处于就绪状态的 Pod 百分比。 |
容器指标
命名空间:Insights.container/containers
维度:containerName
、、、 controllerName
Kubernetes namespace
podName
度量 | 说明 |
---|---|
(旧)CPU超限百分比 | 超过用户可配置的阈值(默认阈值为 95.0)的容器 CPU 利用率百分比,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 已收集 |
(新)CPU阈值超出 | 容器 CPU 利用率百分比超过用户可配置的阈值(默认阈值为 95.0)时触发的指标,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 已收集 |
旧memoryRss超限百分比 | 超过用户可配置的阈值(默认阈值为 95.0)的容器内存 RSS 百分比,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 |
新内存RSS阈值已违反 | 容器内存 RSS 百分比超过用户可配置的阈值(默认阈值为 95.0)时触发的指标,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 |
(旧)memoryWorkingSetExceededPercentage | 超过用户可配置的阈值(默认阈值为 95.0)的容器内存工作集百分比,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 |
(新)内存工作集阈值违规 | 容器内存工作集百分比超过用户可配置的阈值(默认阈值为 95.0)时触发的指标,按容器名称、控制器名称、Kubernetes 命名空间和 Pod 名称列出。 |
永久性卷指标
命名空间:Insights.container/persistentvolumes
维度:kubernetesNamespace
、、、 node
podName
volumeName
度量 | 说明 |
---|---|
(旧)PV使用超出百分比 | 超过用户可配置的阈值(默认阈值为 60.0)的永久性卷 PV 利用率百分比,按声明名称、Kubernetes 命名空间、卷名称、Pod 名称和节点名称列出。 |
(新)PV使用阈值超出 | 在持久卷 (PV) 的利用率百分比超过用户可配置的阈值(默认阈值为 60.0)时,按声明名称、Kubernetes 命名空间、卷名称、Pod 名称和节点名称,触发相应的指标。 |
启用自定义指标
如果群集对容器监控使用托管标识身份验证,则会为您启用自定义指标。 如果没有启用,则需要使用下面的方法之一启用自定义指标。
此过程将“监视指标发布者”角色分配给群集的服务主体。 监视指标发布者仅有权将指标推送到资源。 它不能更改任何状态、更新资源或读取任何数据。 如需了解更多信息,请参阅监视指标发布者角色。 “监视指标发布者”角色要求不适用于已启用 Azure Arc 的 Kubernetes 群集。
先决条件
在更新群集之前,请确认你是 AKS 群集资源上的所有者角色的成员,这样才能收集节点和 Pod 自定义性能指标。 此要求不适用于已启用 Azure Arc 的 Kubernetes 群集。
可用选项
使用以下方法之一为订阅中的单个群集或所有群集启用自定义指标。
验证更新
若要验证是否启用了自定义指标,请打开指标资源管理器,并从指标命名空间中验证是否列出了insights。