你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

概述:在 Azure AI Foundry 门户中部署 AI 模型

Azure AI Foundry 门户中的模型目录是用于发现和使用各种模型的中心,这些模型可用于构建生成式 AI 应用程序。 需要部署模型以使其可用于接收推理请求。 Azure AI Foundry 根据需求和模型要求,为模型提供了全面的部署选项套件。

部署模型

部署选项因模型产品/服务而异:

  • Azure AI Foundry 模型中的 Azure OpenAI: 这些最新的 OpenAI 模型在 Azure AI Foundry 中提供企业功能和灵活的计费选项。
  • 标准部署:这些模型不需要订阅的计算配额,并且按照无服务器的按令牌付费套餐按令牌计费
  • 开放和自定义模型: 模型目录提供跨多种形式访问各种模型的途径,包括可开放访问的模型。 你可以在自己的订阅中托管开放式模型,并使用托管基础结构、虚拟机和实例数量进行容量管理。

Azure AI Foundry 提供四种不同的部署选项:

名称 Azure OpenAI Azure AI Foundry 模型 标准部署 托管计算
可以部署哪些模型? Azure OpenAI 模型 Azure OpenAI 模型和标准部署 标准部署 开放和自定义模型
部署资源 Azure OpenAI 资源 Azure AI 服务资源 AI 项目资源 AI 项目资源
需要中心/项目 是的 是的
数据处理选项 区域
数据区域
全球
全球 区域 区域
专用网络 是的 是的 是的 是的
内容筛选 是的 是的 是的
自定义内容筛选 是的 是的
无密钥身份验证 是的 是的
最适用于以下情况: 你计划仅使用 OpenAI 模型 你计划利用 Azure AI 目录中的旗舰模型,包括 OpenAI。 你计划使用特定提供商(不包括 OpenAI)的一种模型。 如果你计划使用开放模型,并且订阅中有足够的计算配额。
计费依据 令牌使用情况和 预配的吞吐量单位 令牌使用情况 令牌使用情况1 计算核心小时数2
部署说明 部署到 Azure OpenAI 部署到 Foundry 模型 部署到标准部署 部署到托管计算

1 最小终结点基础结构按分钟计费。 你无需为托管标准部署模型的基础结构付费。 删除终结点后,不会继续产生费用。

2 按分钟计费,具体取决于产品层以及自创建以来部署中使用的实例数量。 删除终结点后,不会继续产生费用。

小窍门

若要详细了解如何跟踪成本,请参阅监视通过 Azure 市场提供的模型的成本

如何考虑部署选项?

Azure AI Foundry 鼓励你探索各种部署选项,并选择最适合业务和技术需求的部署选项。 一般情况下,请考虑使用以下方法来选择部署选项:

  • Foundry Models 开始,该模型是具有最大作用域的选项。 使用此选项,您可以在应用程序中更快地进行迭代开发和打样,而无需每次做出更改时都重新构建架构。 如果使用的是 Azure AI Foundry 中心或项目,请启用此选项,方法是 启用 Foundry 模型功能

  • 想要使用特定模型时:

    • 如果对 Azure OpenAI 模型感兴趣,请在 Foundry 模型中使用 Azure OpenAI。 此选项适用于 Azure OpenAI 模型,并为它们提供各种功能。

    • 如果你对无服务器按令牌付费套餐中的特定模型感兴趣,并且不打算使用任何其他类型的模型,请使用标准部署。 标准部署允许在一组唯一的终结点 URL 和密钥下部署单个模型。

  • 如果模型在标准部署中不可用,并且订阅中有可用的计算配额,请使用支持部署开放模型和自定义模型的 托管计算。 它还允许对部署推理服务器、协议和详细配置进行高级别的自定义。