Azure 容器应用的配额

Azure 容器应用将不同的配额类型分配给不同的范围。 除了订阅范围,配额也适用于区域、环境和应用程序范围。 所有配额请求都使用 Azure 配额管理系统(QMS)启动,该系统提供两个选项来发出配额请求。

请求类型 DESCRIPTION 用于这些范围... 查看请求状态方式
集成请求 集成请求通常在几分钟内获得批准。 如果请求超过配额阈值,则会为支持工程师生成支持票证来评审请求。 评审时间可能会导致审批延迟几天。 ▪ 地区

▪ 订阅
Azure 门户
手动请求 手动请求始终会导致生成支持票证。 审批通常是自动化的,但一些请求最多可能需要几天时间才能处理。 ▪ 环境 Azure CLI

注意

Azure 容器应用是专为大规模工作负荷设计的生产级服务。 发出向支持团队呈报的配额请求并非不符合惯例,而是代表我们的客户管理资源过程中的一部分。 Azure 容器应用是一项大规模服务。 大多数配额更改请求都会被批准,例外情况仅限于有限的情形。.

查看当前配额级别

可以通过 Azure 门户 和 Azure CLI 查看配额级别,具体取决于配额类型。

在门户中,选择“Azure 容器应用”作为“提供程序”。

配额窗口中服务提供商和订阅信息下拉列表的屏幕截图。

通过手动方法发出的配额更改请求在门户中不可用。 使用以下命令查看每个环境的配额。

运行以下命令之前,请确保将 <> 括起来的占位符替换为自己的值。

az containerapp env list-usages \
  --resource-group <RESOURCE_GROUP_NAME> \
  --name <ENVIRONMENT_NAME>

何时请求配额

如果环境或订阅达到配额限制,可能会产生意外的后果,包括:

  • 对应用缩放限制
  • 预配因失败超时
  • 容器应用环境或工作负荷配置文件创建失败

默认配额取决于包括订阅年龄和类型以及服务使用的因素。 如果应用每分钟可以接收数千个请求,请在将应用程序移动到生产环境之前检查当前的配额分配。

如果遇到类似示例中的 托管环境的最大允许核心数已超出 错误,您需要请求增加配额。

Maximum Allowed Cores exceeded for the Managed Environment.

Please check https://learn.microsoft.com/en-us/azure/container-apps/quotas for resource limits

其他错误消息可能指示已达到环境或其他配额限制。 使用 Azure 配额管理系统可以 监视配额使用情况并发出警报 ,以主动防止约束。

配额类型

Azure 容器应用实现不同类别的配额,这些配额控制应用的不同方面的资源分配。 这些配额分为控制基本资源限制的基本配额、应用程序需要专用计算功能的 GPU 配额,以及处理基于会话的工作负荷的动态会话配额。

基本配额

下表列出了请求最多的配额更改。 每个范围表明每个配额的适用范围。 区域范围的配额会根据每个区域更改。 在环境范围内的配额需针对每个环境进行请求。

配额 范围 请求 查看 注解
托管环境数量 区域 集成请求 门户 每个区域的环境数。
托管环境消耗核心 环境 手动请求 CLI 分配给环境使用的最大消耗核心数。 此值是环境中每个活动副本(跨所有应用)请求的核心之和。
托管环境常规用途核心 环境 手动请求 CLI 环境中所有常规用途配置文件可用的核心总数(D 系列)。
托管环境内存优化核心 环境 手动请求 CLI 环境中所有内存优化 (E-series) 配置文件可用的核心总数。

GPU 配额

配额 范围 请求 查看 注解
订阅消耗 NCA 100 GPU 区域 集成请求 门户 此区域中的最大消耗 A100 GPU 核心环境数被分配使用。
订阅消耗 T 4 GPU 区域 集成请求 门户 此区域中的最大消耗 T4 GPU 核心环境数被分配使用。
订阅 NCA 100 GPU 区域 集成请求 门户 在此区域中,最大专用 A100 GPU 核心环境的数量已被分配用于使用。

动态会话配额

配额 范围 请求 查看 注解
会话池 区域 集成请求 门户 每个区域的最大动态会话池数。