部署经过微调的模型进行推理

微调模型后,可以部署模型,并在自己的应用程序中使用它。

部署模型时,你将使模型可用于推理,这会产生每小时托管费用。 但是,经过微调的模型可以免费存储在 Azure AI Foundry 中,直到您准备好使用它们。

Azure OpenAI 为托管结构上的优化模型提供了部署类型的选择,这些模型适合不同的业务和使用模式: 标准全局标准 (预览版)和 预配托管 (预览版)。 详细了解 优化模型的部署类型 以及 所有部署类型的概念

部署优化后的模型

若要部署自定义模型,请选择要部署的自定义模型,然后选择“ 部署”。

此时会打开“部署模型”对话框。 在该对话框中,输入部署名称,然后选择“创建”,开始部署自定义模型。

屏幕截图显示了如何在 Azure AI Foundry 门户中部署自定义模型。

可在 Azure AI Foundry 门户的“部署”窗格中监视部署进度

UI 不支持跨区域部署,而 Python SDK 或 REST 支持。

重要

在你部署自定义模型之后,如果部署处于非活动状态的时间超过十五 (15) 天,则会删除部署。 如果模型是在超过十五 (15) 天前部署的且在连续 15 天内无补全或聊天补全调用,则自定义模型的部署处于非活动状态。

删除非活动状态的部署时,不会删除或影响基础自定义模型,并且可以随时重新部署自定义模型。 如 Azure AI Foundry 模型中的 Azure OpenAI 定价中所述,所部署的每个自定义(微调)模型都会产生每小时托管成本,而无论是否对模型进行补全或聊天补全调用。 若要详细了解如何使用 Azure OpenAI 规划和管理成本,请参阅 计划管理 Azure OpenAI 成本的指南。

使用部署的微调模型

部署自定义模型后,可像使用任何其他已部署的模型一样使用它。 可以使用 Azure AI Foundry 门户中Playgrounds 来试验新部署。 可以继续对自定义模型使用相同的参数,例如 temperaturemax_tokens,就像对其他已部署的模型一样。

Azure AI Foundry 门户中的“操场”窗格屏幕截图,其中突出显示了某些部分。

提示缓存

Azure OpenAI 微调对一组精选的模型支持提示缓存。 通过使用提示缓存,可以减少提示开头具有相同内容的较长提示的总体请求延迟和成本。 若要了解有关提示缓存的详细信息,请参阅提示缓存入门

部署类型

Azure OpenAI 微调支持以下部署类型。

标准

标准部署 提供按呼叫付费计费模型,并且每个区域中可用的模型以及吞吐量可能会受到限制。

模型 区域
GPT-4o-finetune 美国东部 2、美国中北部、瑞典中部
gpt-4o-mini-2024-07-18 美国中北部、瑞典中部
GPT-4-finetune 美国中北部、瑞典中部
GPT-35-Turbo-finetune 美国东部 2、美国中北部、瑞典中部、瑞士西部
GPT-35-Turbo-1106-finetune 美国东部 2、美国中北部、瑞典中部、瑞士西部
GPT-35-Turbo-0125-finetune 美国东部 2、美国中北部、瑞典中部、瑞士西部

全球标准

全球标准 微调部署可 节省成本,但自定义模型权重可能会暂时存储在 Azure OpenAI 资源的地理位置之外。

模型 区域
GPT-4.1-finetune 美国东部 2、美国中北部和瑞典中部
GPT-4.1-mini-finetune 美国东部 2、美国中北部和瑞典中部
GPT-4.1-nano-finetune 美国东部 2、美国中北部和瑞典中部
GPT-4o-finetune 美国东部 2、美国中北部和瑞典中部
GPT-4o-mini-finetune 美国东部 2、美国中北部和瑞典中部

使用微调模型的“全球标准”部署用户体验的屏幕截图。

预配托管

模型 区域
GPT-4o-finetune 美国中北部、瑞典中部
GPT-4o-mini-finetune 美国中北部、瑞典中部

预配托管微调部署为对延迟敏感的代理和应用程序提供了可预测的性能。 它们使用与基本模型相同的区域预配吞吐量(PTU)容量,因此,如果已有区域 PTU 配额,则可以在支持区域中部署微调的模型。

清理部署

若要删除部署,请使用 部署 - 删除 REST API 并将 HTTP DELETE 发送到部署资源。 与创建部署一样,必须包含以下参数:

  • Azure 订阅 ID
  • Azure 资源组名称
  • Azure OpenAI 资源名称
  • 要删除的部署的名称

下面是用于删除部署的 REST API 示例:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>api-version=2024-10-21" \
  -H "Authorization: Bearer <TOKEN>"

还可以在 Azure AI Foundry 门户中删除部署,或使用 Azure CLI

后续步骤