你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI Foundry 门户中的模型目录是用于发现和使用各种模型的中心,这些模型可用于构建生成式 AI 应用程序。 需要部署模型以使其可用于接收推理请求。 Azure AI Foundry 根据需求和模型要求,为模型提供了全面的部署选项套件。
部署模型
部署选项因模型产品/服务而异:
- Azure AI Foundry 模型中的 Azure OpenAI: 这些最新的 OpenAI 模型在 Azure AI Foundry 中提供企业功能和灵活的计费选项。
- 标准部署:这些模型不需要订阅的计算配额,并且按照无服务器的按令牌付费套餐按令牌计费。
- 开放和自定义模型: 模型目录提供跨多种形式访问各种模型的途径,包括可开放访问的模型。 你可以在自己的订阅中托管开放式模型,并使用托管基础结构、虚拟机和实例数量进行容量管理。
Azure AI Foundry 提供四种不同的部署选项:
名称 | Azure OpenAI | Azure AI Foundry 模型 | 标准部署 | 托管计算 |
---|---|---|---|---|
可以部署哪些模型? | Azure OpenAI 模型 | Azure OpenAI 模型和标准部署 | 标准部署 | 开放和自定义模型 |
部署资源 | Azure OpenAI 资源 | Azure AI 服务资源 | AI 项目资源 | AI 项目资源 |
需要中心/项目 | 否 | 否 | 是的 | 是的 |
数据处理选项 | 区域 数据区域 全球 |
全球 | 区域 | 区域 |
专用网络 | 是的 | 是的 | 是的 | 是的 |
内容筛选 | 是的 | 是的 | 是的 | 否 |
自定义内容筛选 | 是的 | 是的 | 否 | 否 |
无密钥身份验证 | 是的 | 是的 | 否 | 否 |
最适用于以下情况: | 你计划仅使用 OpenAI 模型 | 你计划利用 Azure AI 目录中的旗舰模型,包括 OpenAI。 | 你计划使用特定提供商(不包括 OpenAI)的一种模型。 | 如果你计划使用开放模型,并且订阅中有足够的计算配额。 |
计费依据 | 令牌使用情况和 预配的吞吐量单位 | 令牌使用情况 | 令牌使用情况1 | 计算核心小时数2 |
部署说明 | 部署到 Azure OpenAI | 部署到 Foundry 模型 | 部署到标准部署 | 部署到托管计算 |
1 最小终结点基础结构按分钟计费。 你无需为托管标准部署模型的基础结构付费。 删除终结点后,不会继续产生费用。
2 按分钟计费,具体取决于产品层以及自创建以来部署中使用的实例数量。 删除终结点后,不会继续产生费用。
小窍门
若要详细了解如何跟踪成本,请参阅监视通过 Azure 市场提供的模型的成本。
如何考虑部署选项?
Azure AI Foundry 鼓励你探索各种部署选项,并选择最适合业务和技术需求的部署选项。 一般情况下,请考虑使用以下方法来选择部署选项:
从 Foundry Models 开始,该模型是具有最大作用域的选项。 使用此选项,您可以在应用程序中更快地进行迭代开发和打样,而无需每次做出更改时都重新构建架构。 如果使用的是 Azure AI Foundry 中心或项目,请启用此选项,方法是 启用 Foundry 模型功能。
想要使用特定模型时:
如果对 Azure OpenAI 模型感兴趣,请在 Foundry 模型中使用 Azure OpenAI。 此选项适用于 Azure OpenAI 模型,并为它们提供各种功能。
如果你对无服务器按令牌付费套餐中的特定模型感兴趣,并且不打算使用任何其他类型的模型,请使用标准部署。 标准部署允许在一组唯一的终结点 URL 和密钥下部署单个模型。
如果模型在标准部署中不可用,并且订阅中有可用的计算配额,请使用支持部署开放模型和自定义模型的 托管计算。 它还允许对部署推理服务器、协议和详细配置进行高级别的自定义。