你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

计划管理 Azure AI Foundry 模型的成本

本文介绍如何查看、规划和管理 Azure AI Foundry 模型的成本。

虽然本文介绍如何规划和管理 Azure AI Foundry 模型的成本,但需针对 Azure 订阅中使用的所有 Azure 服务和资源付费。

先决条件

  • 成本管理中的成本分析支持大多数 Azure 帐户类型,但不支持所有帐户类型。 若要查看支持的帐户类型的完整列表,请参阅了解成本管理数据
  • 若要查看成本数据,至少需要对 Azure 帐户具有读取访问权限。 若要了解如何分配对成本管理数据的访问权限,请参阅分配对数据的访问权限

了解 Foundry Models 的计费模型

语言模型通过将输入分解为令牌来理解和处理输入。 作为参考,对于典型的英文文本,每个标记大约是四个字符。 处理图像或音频的模型也会将它们分解为令牌,以便进行计费。 每个图像或音频内容的令牌数取决于模型和输入分辨率。

每个令牌的成本因你选择的模型系列而异,但在所有情况下,在 Azure AI Foundry 中部署的模型都按 1,000 个令牌收费。 令牌成本是针对输入和输出计算的。 例如,假设你有 1,000 个标记的 JavaScript 代码示例,且要求模型将代码转换为 Python。 首先你要为发送的初始输入请求的 1,000 个令牌支付费用,然后还要针对接收的响应支付输出的 1,000 个令牌的费用,总共涉及的是 2,000 个令牌。

成本明细

若要了解构成成本的细目,在 Azure 门户中使用成本分析工具会很有帮助。 按照以下步骤了解推理成本:

  1. 转到 Azure AI Foundry 门户

  2. 在屏幕的右上角,单击 Azure AI Foundry 的资源名称(以前称为 Azure AI 服务),或者如果你正在处理 AI 项目,请单击项目名称。

  3. 选择项目的名称。 Azure 门户会在新窗口中打开。

    有关如何从 Azure AI Foundry 门户访问 Azure 门户中的资源组详细信息页的屏幕截图。

  4. 在“成本管理”下,选择“成本分析”

  5. 默认情况下,成本分析的范围限定为所选资源组。

    重要

    成本分析 范围限定为部署 Azure AI Foundry 资源的资源组非常重要。 与 合作伙伴和社区中的模型 关联的成本计量显示在资源组下,而不是 Azure AI Foundry 资源。

  6. 将“分组依据”修改为“计量”。 现在可以看到,对于此特定资源组,成本的来源来自不同的模型系列。

    有关如何按资源组中的每个计量查看成本的屏幕截图。

以下部分详细介绍了这些条目。

由 Azure 直接销售的模型

Azure 直接销售的模型(包括 Azure OpenAI)是直接收费的,它们显示为每个 Azure AI Foundry 资源(以前称为 Azure AI 服务)下的计费计量器。 此计费直接通过 Microsoft 进行。 检查帐单时,你会注意到计费计量会计入每个已使用模型的输入和输出。

成本分析仪表板的屏幕截图,该仪表板的范围限定为部署 Azure AI Foundry 资源的资源组,其中突出显示了 Azure OpenAI 和 Phi 模型的计量。成本按计量分组。

来自合作伙伴和社区的模型

第三方提供商提供的模型(如 Cohere)使用 Azure 市场计费。 与 Microsoft 计费系统不同,这些记录与部署 Azure AI Foundry(前称为 Azure AI 服务)的资源组相关联,而不是与 Azure AI Foundry 资源本身直接关联。 由于模型供应商直接向你收费,你将在类别 市场服务名称SaaS 下看到一些条目,这些条目用于记录每个已使用模型的输入和输出。

成本分析仪表板的屏幕截图,其范围限定为部署 Azure AI Foundry 资源的资源组,其中突出显示了通过 Azure 市场计费的模型的计量。成本按计量器分组。

重要

Azure 直接销售的模型 (包括 Azure OpenAI)与来自合作伙伴和社区的模型之间的这种区别只会影响模型可供你使用的方式以及计费方式。 在所有情况下,模型都托管在 Azure 云中,并且与外部服务或提供商没有交互。

使用 Azure 预付款

可以使用 Azure 预付款额度支付 Azure 直接销售的模型费用。 但是,无法使用 Azure 预付款额度支付其他提供商模型的费用,因为它们通过 Azure 市场计费。

HTTP 错误响应代码和计费状态

如果服务执行处理,即使状态代码不成功(不是 200),也可能需要支付费用。 例如,由于内容筛选器或输入限制导致的 400 错误,或由于超时导致的 408 错误。

如果服务不进行处理,则不需要支付费用。 例如,由于身份验证导致的 401 错误或由于超过速率限制导致的 429 错误。

监视成本

Azure 资源使用单位成本因时间间隔(如秒、分钟、小时和天)或单位使用量(如字节、MB 等)而异。 Azure AI 服务一开始使用就会产生成本,你可以在成本分析中查看成本。

可以使用成本分析获取更详细的计费信息:

若要了解构成该成本的细目,在 Azure 门户中使用成本分析工具会很有帮助。

  1. 转到 Azure AI Foundry 门户

  2. 在屏幕右上角,选择 Azure AI 服务资源的名称,或者如果你正在处理 AI 项目,请选择项目的名称。

  3. 选择项目的名称。 Azure 门户会在新窗口中打开。

  4. 在“成本管理”下,选择“成本分析”

  5. 默认情况下,成本分析的范围限定为所选资源组。

  6. 由于我们会看到所有资源组的成本,因此按资源查看成本非常有用。 在这种情况下,请选择“查看”“按资源分类的成本”。>

    有关如何按资源组中的每个资源查看成本的屏幕截图。

  7. 现在,可以看到生成每个计费计量的资源。

  8. 如前所述,Azure OpenAI 模型和 Microsoft 模型显示为每个 Azure AI 服务资源下的计量:

    成本分析仪表板的屏幕截图,其范围限定为部署 Azure AI 服务资源的资源组,其中突出显示了 Azure OpenAI 和 Microsoft 模型的计量。成本按资源分组。

  9. 某些提供商的模型显示为全局资源下的计量。 请注意,“全局”一词与模型部署的 SKU 无关(例如“全局标准”)。 如果有多个 Azure AI 服务资源,则帐单会为每个 Azure AI 服务资源的每个模型都包含一个条目。 资源计量的格式为 [model-name]-[GUID],其中 [GUID] 是与给定 Azure AI 服务资源关联的唯一标识符。 注意计入已使用的每个模型的输入和输出的计费计量。

    成本分析仪表板的屏幕截图,其范围限定为部署 Azure AI 服务资源的资源组,其中突出显示了通过 Azure 市场计费的模型的计量。成本按资源分组。

评估与 Azure AI 服务相关的成本时,必须了解范围。 如果资源是同一资源组的一部分,则可以在该级别确定成本分析的范围,以了解对成本的影响。 如果资源分布在多个资源组中,则可以将范围限定为订阅级别。

创建预算

可以创建预算来管理成本,并创建警报来通知利益干系人支出异常和超支风险。 警报基于与预算和成本阈值相比的支出。 为 Azure 订阅和资源组创建预算和警报。 作为整体成本监视策略的一部分,它们很有用。

如果希望可以更加精细地进行监视,可以在 Azure 中使用特定资源或服务的筛选器创建预算。 筛选器可帮助确保不会意外创建会产生额外成本的新资源。 有关创建预算时可用的筛选选项的详细信息,请参阅分组和筛选选项

导出成本数据

你还可以将成本数据导出到存储帐户,这在需要其他人执行额外的成本数据分析时非常有用。 例如,财务团队可以使用 Excel 或 Power BI 来分析数据。 可以按每天、每周或每月计划导出成本,并设置自定义的日期范围。 建议将导出成本数据作为检索成本数据集的方法。

其他成本

启用将数据发送到 Azure Monitor 日志和警报等功能会导致这些服务产生额外费用。 这些成本在其他服务下和订阅级别可见,但如果范围仅限于 Azure AI 服务资源,则不可见。

后续步骤