Azure 容器应用将不同的配额类型分配给不同的范围。 除了订阅范围,配额也适用于区域、环境和应用程序范围。 所有配额请求都使用 Azure 配额管理系统(QMS)启动,该系统提供两个选项来发出配额请求。
请求类型 | DESCRIPTION | 用于这些范围... | 查看请求状态方式 |
---|---|---|---|
集成请求 | 集成请求通常在几分钟内获得批准。 如果请求超过配额阈值,则会为支持工程师生成支持票证来评审请求。 评审时间可能会导致审批延迟几天。 | ▪ 地区 ▪ 订阅 |
Azure 门户 |
手动请求 | 手动请求始终会导致生成支持票证。 审批通常是自动化的,但一些请求最多可能需要几天时间才能处理。 | ▪ 环境 | Azure CLI |
注意
Azure 容器应用是专为大规模工作负荷设计的生产级服务。 发出向支持团队呈报的配额请求并非不符合惯例,而是代表我们的客户管理资源过程中的一部分。 Azure 容器应用是一项大规模服务。 大多数配额更改请求都会被批准,例外情况仅限于有限的情形。.
查看当前配额级别
可以通过 Azure 门户 和 Azure CLI 查看配额级别,具体取决于配额类型。
在门户中,选择“Azure 容器应用”作为“提供程序”。
通过手动方法发出的配额更改请求在门户中不可用。 使用以下命令查看每个环境的配额。
运行以下命令之前,请确保将 <>
括起来的占位符替换为自己的值。
az containerapp env list-usages \
--resource-group <RESOURCE_GROUP_NAME> \
--name <ENVIRONMENT_NAME>
何时请求配额
如果环境或订阅达到配额限制,可能会产生意外的后果,包括:
- 对应用缩放限制
- 预配因失败超时
- 容器应用环境或工作负荷配置文件创建失败
默认配额取决于包括订阅年龄和类型以及服务使用的因素。 如果应用每分钟可以接收数千个请求,请在将应用程序移动到生产环境之前检查当前的配额分配。
如果遇到类似示例中的 托管环境的最大允许核心数已超出 错误,您需要请求增加配额。
Maximum Allowed Cores exceeded for the Managed Environment.
Please check https://learn.microsoft.com/en-us/azure/container-apps/quotas for resource limits
其他错误消息可能指示已达到环境或其他配额限制。 使用 Azure 配额管理系统可以 监视配额使用情况并发出警报 ,以主动防止约束。
配额类型
Azure 容器应用实现不同类别的配额,这些配额控制应用的不同方面的资源分配。 这些配额分为控制基本资源限制的基本配额、应用程序需要专用计算功能的 GPU 配额,以及处理基于会话的工作负荷的动态会话配额。
基本配额
下表列出了请求最多的配额更改。 每个范围表明每个配额的适用范围。 区域范围的配额会根据每个区域更改。 在环境范围内的配额需针对每个环境进行请求。
配额 | 范围 | 请求 | 查看 | 注解 |
---|---|---|---|---|
托管环境数量 | 区域 | 集成请求 | 门户 | 每个区域的环境数。 |
托管环境消耗核心 | 环境 | 手动请求 | CLI | 分配给环境使用的最大消耗核心数。 此值是环境中每个活动副本(跨所有应用)请求的核心之和。 |
托管环境常规用途核心 | 环境 | 手动请求 | CLI | 环境中所有常规用途配置文件可用的核心总数(D 系列)。 |
托管环境内存优化核心 | 环境 | 手动请求 | CLI | 环境中所有内存优化 (E-series) 配置文件可用的核心总数。 |
GPU 配额
配额 | 范围 | 请求 | 查看 | 注解 |
---|---|---|---|---|
订阅消耗 NCA 100 GPU | 区域 | 集成请求 | 门户 | 此区域中的最大消耗 A100 GPU 核心环境数被分配使用。 |
订阅消耗 T 4 GPU | 区域 | 集成请求 | 门户 | 此区域中的最大消耗 T4 GPU 核心环境数被分配使用。 |
订阅 NCA 100 GPU | 区域 | 集成请求 | 门户 | 在此区域中,最大专用 A100 GPU 核心环境的数量已被分配用于使用。 |
动态会话配额
配额 | 范围 | 请求 | 查看 | 注解 |
---|---|---|---|---|
会话池 | 区域 | 集成请求 | 门户 | 每个区域的最大动态会话池数。 |