你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

“Azure AI Foundry 中的 Azure OpenAI 模型”模型弃用和停用

概述

Azure OpenAI 模型通过更新且功能更强的模型不断刷新。 在此过程中,我们会弃用和停用较旧的模型。 本文档提供了有关当前可用、已弃用和已停用模型的信息。

术语

  • 弃用
    • 当一个模型被停用时,它将不再对新客户开放使用。 在模型停用之前,拥有现有部署的客户可以继续使用它。
  • 停用
    • 当模型停用时,它不再可供使用。 已停用模型的 Azure OpenAI 部署始终返回错误响应。

通知

对于即将停用的模型,Azure OpenAI 会向具有有效 Azure OpenAI 部署的客户发送通知。 对于每个部署,我们会通知客户即将停用的情况,如下所示:

  1. 在模型推出时,我们以编程方式指定一个“不早于”的停用日期(对于预览模型,这是从发布起的 90-120 天;对于正式发布 (GA) 模型,这是从上线起的 365 天)。
  2. 在正式版 (GA) 模型停用前至少 60 天通知。
  3. 预览模型版本升级前提前至少 30 天发出通知。

退休会按地区逐步进行。 特定区域或 SKU 的升级时间没有计划。

谁收到有关即将停用的通知

Azure OpenAI 通过两种方法通知客户:

  • Azure 资源运行状况 - 具有读取者权限或更高权限的任何人都可以查看 Azure 运行状况警报,以及通过电子邮件、短信等配置个性化警报。请参阅“创建服务运行状况警报
  • 电子邮件 - 电子邮件通知会自动发送到订阅所有者。 但是,任何具有读取者权限的个人均可按照上述指南配置自己的警报。

Azure 服务运行状况筛选器配置

服务业 = azure OpenAI service (大小写反映了当前的 UX 体验)。

事件类型- Health advisories = Upgrade, Deprecation, & Retirement Notifications- Service issue = Outages (仅当希望收到中断通知时才建议)

如果要接收基于短信的警报,而不仅仅是电子邮件,则需要选择“ 创建作组 ”,然后在“ 通知类型”下选择“ 电子邮件/短信/推送/语音 ”,然后配置电话号码。

模型可用性

  1. 在全球至少一个区域的模型发布日期之后,GA 模型至少有一年的模型可用性
  2. 对于全局部署,所有从gpt-4ogpt-4 0409开始的未来模型版本都将与其(N)随后推出的模型(N+1)一起进行比较。
  3. 在对较新的 GA 模型进行任何升级之前,客户在至少一个全局或标准区域中试用新的 GA 模型 60 天。

Azure 公有云的注意事项

请注意以下事项:

  1. 并非所有地区都提供所有模型版本组合。
  2. 模型版本NN+1可能并不总是在同一区域中可用。
  3. GA 模型版本N可能会根据容量限制在一些区域中升级到未来的模型版本N+X,并且没有新的模型版本N+X可单独用于在同一区域中进行测试。 在计划任何升级之前,新模型版本将可用于在其他区域中进行测试。
  4. 同一模型的预览模型版本和 GA 版本并不总是可用于在同一区域中一起测试。 将有预览版本和 GA 版本可供在不同区域中进行测试。
  5. 我们保留限制未来客户使用特定区域来平衡现有客户的服务质量的权利。
  6. 在 Microsoft,安全始终是最重要的。 如果发现模型或模型版本存在合规性或安全问题,我们保留要求紧急停用的权利。 有关详细信息,请参阅服务条款。

Azure 政府云的特殊注意事项

  1. 全局标准部署在政府云中不可用。
  2. 并非所有商业/公有云中可用的模型或模型版本都将在政府云中提供。
  3. 在 Azure 政府云中,我们计划一次只支持一个给定模型的一个版本。
    1. 例如,gpt-35-turbo 0125gpt-4o (2024-05-13)只有一个版本。
  4. 但是,新模型版本之间将有 30 天重叠,其中两个以上的版本将可用。
    1. 例如,如果gpt-35-turbo 0125gpt-4o (2024-05-13)更新为未来版本,或者
    2. 对于版本更新之外的模型系列更改,例如从 gpt-4 1106-preview 移动到 gpt-4o (2024-05-13) 时。

如何为模型停用和版本升级做好准备

为了准备模型停用和版本升级,建议客户使用新模型和版本测试应用程序,并评估其行为。 还建议客户在停用日期之前更新应用程序以使用新模型和版本。

有关模型评估过程的详细信息,请参阅模型评估入门指南

有关模型升级过程的信息,请参阅如何升级到新模型或版本

有关如何管理预配部署的模型升级和迁移的详细信息,请参阅管理预配部署类型的模型

当前模型

注意

并非所有模型在停用前都会经历弃用期。 某些模型/版本只有停用日期。

微调的模型受其等效基本模型中的不同弃用和停用计划约束

这些模型目前可用于 Azure OpenAI。

文本生成

模型 版本 停用日期 替换模型
gpt-4.5-preview 2025-02-27 无自动升级
2025 年 7 月 14 日
gpt-4.1 版本:2025-04-14
gpt-3.5-turbo-instruct 0914 不早于 2025 年 7 月 16 日
o1-preview 2024-09-12 2025 年 7 月 28 日 o1
computer-use-preview 2025年3月11日 不早于 2025 年 9 月 1 日
gpt-35-turbo 1106 不早于 2025 年 9 月 1 日 gpt-4.1-mini 版本:2025-04-14
gpt-35-turbo 0125 不早于 2025 年 9 月 1 日 gpt-4.1-mini 版本:2025-04-14
gpt-4 turbo-2024-04-09 不早于 2025 年 9 月 1 日 gpt-4o 版本:2024-11-20
model router 2025年05月19日 不早于 2025 年 9 月 1 日
gpt-4o 2024年5月13日 不早于 2025 年 9 月 15 日 gpt-4.1 版本:2025-04-14
gpt-4o-mini 2024年07月18日 不早于 2025 年 9 月 15 日 gpt-4.1-mini 版本:2025-04-14
o1-mini 2024-09-12 不早于 2025 年 9 月 26 日
gpt-4o 2024-08-06 不早于 2025 年 10 月 15 日 gpt-4.1 版本:2025-04-14
o1 2024年12月17日 不早于 2025 年 12 月 17 日
o3-mini 2025年01月31日 不早于 2026 年 2 月 1 日
gpt-4o 2024年11月20日 不早于 2026 年 3 月 1 日 gpt-4.1 版本:2025-04-14
gpt-4.1 2025-04-14 不早于 2026 年 4 月 11 日
gpt-4.1-mini 2025-04-14 不早于 2026 年 4 月 11 日
gpt-4.1-nano 2025-04-14 不早于 2026 年 4 月 11 日
o4-mini 2025-04-16 不早于 2026 年 4 月 11 日
o3 2025-04-16 不早于 2026 年 4 月 11 日

在升级开始前至少 30 天,我们会向所有客户通知这些预览部署。 我们发布一个升级计划,详细说明我们在升级期间遵循的区域和模型版本的顺序,并在此处链接到该计划。

小提示

如果新模型版本在该区域中尚不可用,模型升级是否会发生?

是的,即使在某个区域中尚未提供最新模型版本的情况下,我们也会在计划的升级时段内自动升级部署。 有关详细信息,请参阅 Azure OpenAI 模型版本

微调的模型

微调模型分两个阶段停用:训练和部署。

所有微调的模型都遵循其等效的基础模型进行训练停用。 停用后,给定模型不再可用于微调。

对于自 gpt-4o-2024-08-06 以来普遍可用的微调模型,部署停用发生在训练停用 1 年后。 在部署停用时,推理和部署会返回错误响应。

模型 版本 训练停用日期 部署停用日期
gpt-35-turbo 1106 基础模型停用时 训练停用时
gpt-35-turbo 0125 基础模型停用时 训练停用时
gpt-4o 2024-08-06 基础模型停用时 训练停用一年后
gpt-4o-mini 2024年07月18日 基础模型停用时 训练停用一年后
gpt-4.1 2025-04-14 基础模型停用时 训练停用一年后
gpt-4.1-mini 2025-04-14 基础模型停用时 训练停用一年后
gpt-4.1-nano 2025-04-14 基础模型停用时 训练停用一年后
o4-mini 2025-04-16 基础模型停用时 训练停用一年后

默认模型版本

模型 当前默认版本 新默认版本 默认升级日期
gpt-35-turbo 0301 0125 从 2025 年 1 月 21 日开始,设置为“0301”的 06131106 版本的部署将自动升级到版本
gpt-4o 2024-08-06 - -

停用和弃用历史记录

若要跟踪本文的各个更新,请参阅 Git 历史记录