Azure AI Foundry 中的 Azure OpenAI 模型

Azure OpenAI 由一组具有不同功能和价格点的不同模型提供支持。 模型可用性因区域和云而异。 有关 Azure 政府版模型的可用性,请参阅 Azure 政府 OpenAI 服务

模型 说明
GPT-4.1 系列 Azure OpenAI 的最新模型版本
model-router 从一组基础聊天模型中智能选择以响应给定提示的模型。
计算机使用预览 一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。
GPT-4.5 预览版 在各种文本和图像任务中表现出色的最新 GPT 模型。
o 系列模型 具有高级问题解决能力、增强的专注力和功能的推理模型
GPT-4o、GPT-4o mini 和 GPT-4 Turbo 功能最强大的最新 Azure OpenAI 模型具有多模态版本,可以接受文本和图像作为输入。
GPT-4 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
GPT-3.5 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
嵌入 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。
图像生成 一系列可从自然语言生成原始图像的模型。
音频 语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟、“语音传入、语音传出”对话交互或音频生成。

GPT 4.1 系列

地区可用性

型号 区域
gpt-4.1 (2025-04-14) 请参阅 模型表
gpt-4.1-nano (2025-04-14) 请参阅 模型表
gpt-4.1-mini (2025-04-14) 请参阅 模型表

能力

模型 ID 说明 上下文窗口 最大输出标记 训练数据(上限)
gpt-4.1 (2025-04-14) - 文本和图像输入
- 文本输出
- 聊天补全 API
- 响应 API
- 流式处理
- 函数调用
结构化输出(聊天补全)
- 1,047,576
- 128,000(预配的托管部署)
32,768 2024 年 5 月 31 日
gpt-4.1-nano (2025-04-14)

最快 4.1 模型
- 文本和图像输入
- 文本输出
- 聊天补全 API
- 响应 API
- 流式处理
- 函数调用
结构化输出(聊天补全)
1,047,576 32,768 2024 年 5 月 31 日
gpt-4.1-mini (2025-04-14) - 文本和图像输入
- 文本输出
- 聊天补全 API
- 响应 API
- 流式处理
- 函数调用
结构化输出(聊天补全)
1,047,576 32,768 2024 年 5 月 31 日

模型路由器

从一组基础聊天模型中智能选择以响应给定提示的模型。

地区可用性

型号 区域
model-router (2025-05-19) 美国东部 2 (全球标准), 瑞典中部 (全球标准)

能力

模型 ID 说明 上下文窗口 最大输出标记 训练数据(上限)
model-router (2025-05-19) 从一组基础聊天模型中智能选择以响应给定提示的模型。 200,000* 32768 (GPT 4.1 系列)
100 K (o4-mini)
2024 年 5 月 31 日

*较大的上下文窗口与 某些 基础模型兼容,这意味着仅当提示被路由到正确的模型时,具有较大上下文的 API 调用才会成功,否则调用将失败。

computer-use-preview

一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。 它可以与第三方库结合使用,以允许模型控制鼠标和键盘输入,同时从当前环境的屏幕截图获取上下文。

注意

我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定 GA 版本。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。

可用性

要访问computer-use-preview,需要注册,并且根据Microsoft的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。

请求访问权限:computer-use-preview受限访问模型应用程序

授予访问权限后,需要为模型创建部署。

地区可用性

型号 区域
computer-use-preview 请参阅 模型表

能力

模型 ID 说明 上下文窗口 最大输出标记 训练数据(上限)
computer-use-preview (2025-03-11) 用于响应 API 计算机使用工具的专用模型

-工具
-流媒体
-文本(输入/输出)
- 图像(输入)
8,192 1,024 2023 年 10 月

GPT-4.5 预览版

地区可用性

型号 区域
gpt-4.5-preview 请参阅 模型表

能力

模型 ID 说明 上下文窗口 最大输出标记 训练数据(上限)
gpt-4.5-preview (2025-02-27)
GPT-4.5 预览版
推荐使用GPT 4.1作为此模型的替代品。 擅长处理各种文本和图像任务。
- 结构化输出
- 提示缓存
-工具
- 流媒体
- 文本(输入/输出)
- 图像(输入)
128,000 16,384 2023 年 10 月

注意

模型无法回答有关自身的问题是预料之中的行为。 如果想知道模型训练数据的知识截止时间,或者有关模型的其他详细信息,则应参考上面的模型文档。

o 系列模型

Azure OpenAI o* 系列模型专门设计用于处理推理和问题解决任务,具有更好的针对性和功能。 这些模型将更多时间花费在处理和理解用户的请求上,与以前的更迭版本相比,它们在科学、编码和数学等领域表现得异常强大。

模型 ID 说明 最大请求(令牌) 训练数据(上限)
o4-mini (2025-04-16) - 新的 推理模型,提供 增强的推理能力

- 聊天补全 API
- 响应 API
- 结构化输出
- 文本、图像处理
- 函数/工具/并行工具调用
功能的完整摘要
输入:200,000
输出:100000
2024 年 5 月 31 日
o3 (2025-04-16) - 新的 推理模型,提供 增强的推理能力

- 聊天补全 API
- 响应 API
- 结构化输出
- 文本、图像处理
- 函数/工具/并行工具调用
功能的完整摘要
输入:200,000
输出:100000
2024 年 5 月 31 日
o3-mini (2025-01-31) - 增强推理能力
- 结构化输出
- 仅文本处理
- 函数/工具
输入:200,000
输出:100000
2023 年 10 月
o1 (2024-12-17) - 增强推理能力
- 结构化输出
- 文本、图像处理
- 函数/工具
输入:200,000
输出:100000
2023 年 10 月
o1-preview (2024-09-12) 较旧的预览版 输入:128,000
输出:32,768
2023 年 10 月
o1-mini (2024-09-12) o1 系列中速度更快、更具成本效益的选项,非常适合需要速度和更低资源消耗的编码任务。

全局标准部署默认可用。

标准(区域)部署目前仅适用于在 o1-preview 受限访问版本中接收访问权限的选择客户。
输入:128,000
输出:65,536
2023 年 10 月

可用性

若要了解有关高级 o-series 模型的详细信息,请参阅 推理模型入门。

地区可用性

型号 区域
o4-mini 请参阅 模型表
o3 请参阅 模型表
o3-mini 请参阅 模型表
o1 请参阅 模型表
o1-preview 请参阅 模型表。 此模型仅适用于在原始受限访问中被授予访问权限的客户
o1-mini 请参阅 模型表

GPT-4o 和 GPT-4 Turbo

GPT-4o 在单个模型中集成文本和图像,从而能够同时处理多个数据类型。 这种多模式方法提高了人机交互的准确性和响应能力。 GPT-4o 在英语文本和编码任务方面与 GPT-4 Turbo 相当,但在非英语语言和视觉任务方面具有更优越的性能,为 AI 功能设定了新的基准。

如何访问 GPT-4o 和 GPT-4o mini 模型?

GPT-4o 和 GPT-4o mini 适用于标准和全局标准模型部署

需要在支持该模型的标准区域或全球标准区域中创建或使用现有资源。

创建资源后,可以 部署 GPT-4o 模型。 如果你要执行编程部署,则模型名称如下

  • gpt-4o版本2024-11-20
  • gpt-4o版本2024-08-06
  • gpt-4o版本2024-05-13
  • gpt-4o-mini版本2024-07-18

GPT-4 Turbo

GPT-4 Turbo 是一个大型多模态模型(接受文本或图像输入并生成文本),它可以比 OpenAI 的任何以前的模型更准确地解决难题。 与 GPT-3.5 Turbo 和较旧的 GPT-4 模型一样,GPT-4 Turbo 针对聊天进行了优化,能够很好地完成传统的补全任务。

GPT-4

GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 模型和 GPT-4 Turbo 模型的基础模型名称均为 gpt-4。 可以通过检查模型版本来区分 GPT-4 模型和 Turbo 模型。

  • gpt-4版本0314
  • gpt-4版本0613
  • gpt-4-32k版本0613

您可以查看模型摘要表中每个模型支持的令牌上下文长度。

GPT-4 模型和 GPT-4 Turbo 模型

  • 这些模型只能与聊天补全 API 一起使用。

请参阅 模型版本 ,了解 Azure OpenAI 如何处理模型版本升级,以及 如何使用模型 来了解如何查看和配置 GPT-4 部署的模型版本设置。

模型 ID 说明 最大请求(令牌) 训练数据(上限)
gpt-4o (2024-11-20)
GPT-4o (Omni)
最新的大型 GA 模型
- 结构化输出
- 文本、图像处理
- JSON 模式
- 并行函数调用
- 提高准确性和响应能力
- 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当
- 在非英语语言和视觉任务方面具有更优越的性能。
- 增强的创意写作能力
输入:128,000
输出:16,384
2023 年 10 月
gpt-4o (2024-08-06)
GPT-4o (Omni)
- 结构化输出
- 文本、图像处理
- JSON 模式
- 并行函数调用
- 提高准确性和响应能力
- 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当
- 在非英语语言和视觉任务方面具有更优越的性能
输入:128,000
输出:16,384
2023 年 10 月
gpt-4o-mini (2024-07-18)
GPT-4o mini
最新的小型 GA 模型
- 速度快、价格低廉、功能强大的模型,是替代 GPT-3.5 Turbo 系列型号的理想选择。
- 文本、图像处理
- JSON 模式
- 并行函数调用
输入:128,000
输出:16,384
2023 年 10 月
gpt-4o (2024-05-13)
GPT-4o (Omni)
文本、图像处理
- JSON 模式
- 并行函数调用
- 提高准确性和响应能力
- 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当
- 在非英语语言和视觉任务方面具有更优越的性能
输入:128,000
输出:4,096
2023 年 10 月
gpt-4 (turbo-2024-04-09)
具有视觉的 GPT-4 Turbo
新版 GA 模型
- 替代了所有以前的 GPT-4 预览版模型(vision-preview1106-Preview0125-Preview)。
- 功能可用性 目前因输入方法和部署类型而异。
输入:128,000
输出:4,096
2023 年 12 月
gpt-4-32k (0613) 旧版 GA 模型
- 使用工具调用基本函数
32,768 2021 年 9 月
gpt-4 (0613) 旧版 GA 模型
- 使用工具调用基本函数
8,192 2021 年 9 月
gpt-4-32k(0314) 旧版 GA 模型
- 停用信息
32,768 2021 年 9 月
gpt-4 (0314) 旧版 GA 模型
- 停用信息
8,192 2021 年 9 月

注意

我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定 GA 版本。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。

GPT-3.5

GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可以与聊天完成 API 一起使用。 GPT-3.5 Turbo 指令具有与使用补全 API 而不是聊天补全 API 类似的功能 text-davinci-003。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct 而不是 旧版 GPT-3.5 和 GPT-3 模型

模型 ID 说明 最大请求(令牌) 训练数据(上限)
gpt-35-turbo (0125) 新 最新 GA 模型
- JSON 模式
- 并行函数调用
- 可重现的输出(预览版)
- 以请求的格式响应的准确度更高。
- 修复了导致非英语函数调用的文本编码问题的 bug。
输入:16,385
输出:4,096
2021 年 9 月
gpt-35-turbo (1106) 旧版 GA 模型
- JSON 模式
- 并行函数调用
- 可重现的输出(预览版)
输入:16,385
输出:4,096
2021 年 9 月
gpt-35-turbo-instruct (0914) 仅限补全终结点
- 替换旧版补全模型
4,097 2021 年 9 月

若要详细了解如何与 GPT-3.5 Turbo 和 Chat Completions API 交互,请查看 我们的深入指南

1 此模型将接受 4,096 个令牌的请求 > 。 不建议超过 4,096 个输入令牌限制,因为较新版本的模型上限为 4,096 个令牌。 如果使用此模型超过 4,096 个输入令牌时遇到问题,则此配置不受正式支持。

嵌入

text-embedding-3-large 是最新且能力最强的嵌入模型。 无法在嵌入模型之间进行升级。 若要从使用 text-embedding-ada-002 转移到 text-embedding-3-large,你需要生成新的嵌入内容。

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

在测试中,OpenAI 报告大型和第三代嵌入模型在 MIRACL 基准中提供更好的平均多语言检索性能,同时仍使用 MTEB 基准保持英语任务的性能。

评估基准 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 平均值 31.4 44.0 54.9
MTEB 平均值 61.0 62.3 64.6

第三代嵌入模型支持通过新的 dimensions 参数减小嵌入的大小。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 调整维度数量的功能让你可以更好地控制总体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions 参数,为了利用此参数,我们建议升级到最新版本:pip install openai --upgrade

OpenAI 的 MTEB 基准测试发现,即使第三代模型的维度减少到了小于 text-embeddings-ada-002 1,536 个维度,性能还是要稍好一些。

图像生成模型

图像生成模型从用户提供的文本提示生成图像。 GPT-image-1 现处于有限开放的公开预览版中。 DALL-E 3 可通过 REST API 供公众使用。 配备客户端 SDK 的 DALL-E 2 和 DALL-E 3 处于预览状态。

可用性

要访问gpt-image-1,需要注册,并且根据Microsoft的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。

请求访问权限:gpt-image-1受限访问模型应用程序

授予访问权限后,需要为模型创建部署。

地区可用性

型号 区域
dall-e-3 美国东部
澳大利亚东部
瑞典中部
gpt-image-1 美国西部 3(全球标准)
阿联酋北部 (全球标准)

音频模型

Azure OpenAI 中的音频模型通过 realtimecompletionsaudio API 提供。

GPT-4o 音频模型

GPT 4o 音频模型是 GPT-4o 模型系列的一部分,支持低延迟的“语音输入,语音输出”对话交互或音频生成。

注意

我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定 GA 版本。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。

下表提供了有关请求令牌上限和训练数据的详细信息。

模型 ID 说明 最大请求(令牌) 训练数据(上限)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o 音频
用于音频和文本生成的音频模型。 输入:128,000
输出:4,096
2023 年 10 月
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o 音频
用于实时音频处理的音频模型。 输入:128,000
输出:4,096
2023 年 10 月
gpt-4o-audio-preview (2024-12-17)
GPT-4o 音频
用于音频和文本生成的音频模型。 输入:128,000
输出:4,096
2023 年 10 月
gpt-4o-realtime-preview (2024-12-17)
GPT-4o 音频
用于实时音频处理的音频模型。 输入:128,000
输出:4,096
2023 年 10 月
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o 音频
用于实时音频处理的音频模型。 输入:128,000
输出:4,096
2023 年 10 月

若要比较所有区域中 GPT-4o 音频模型的可用性,请参阅 模型表

音频 API

通过 API 的 /audio 音频模型可用于语音转文本、翻译和文本转语音。

语音转文本模型

模型 ID 说明 最大请求(音频文件大小)
whisper 常规用途语音识别模型。 25 MB
gpt-4o-transcribe 由 GPT-4o 提供支持的语音转文本。 25 MB
gpt-4o-mini-transcribe 由 GPT-4o mini 提供支持的语音转文本。 25 MB

语音翻译模型

模型 ID 说明 最大请求(音频文件大小)
whisper 常规用途语音识别模型。 25 MB

文本转语音模型(预览版)

模型 ID 说明
tts 文本转语音速度优化。
tts-hd 文本转语音质量优化。
gpt-4o-mini-tts 由 GPT-4o mini 提供支持的文本转语音模型。

你可以使语音以一种风格或语调说话。

有关详细信息,请参阅本文中的 音频模型区域可用性

模型摘要表和区域可用性

按部署类型划分的模型

Azure OpenAI 为客户提供了适合其业务和使用模式的托管结构选择。 该服务提供两种主要部署类型:

  • “标准”类型提供全球部署选项,可在全球范围内路由流量以提供更高的吞吐量
  • “预配”类型也提供全球部署选项,允许客户在 Azure 全球基础结构中购买和部署预配的吞吐量单位

所有部署都可以执行完全相同的推理操作,但计费、规模和性能却大不相同。 若要详细了解 Azure OpenAI 部署类型,请参阅 我们的部署类型指南

全球标准模型可用性

地区 o32025-04-16 o4-mini2025-04-16 gpt-image-12025-04-15 gpt-4.12025-04-14 gpt-4.1-nano2025-04-14 gpt-4.1-mini2025-04-14 计算机使用预览2025-03-11 gpt-4.5-preview2025-02-27 o3-mini2025-01-31 o12024-12-17 o1-preview2024-09-12 o1-mini2024-09-12 gpt-4o,2024-05-13 gpt-4o,2024-08-06 gpt-4o2024-11-20 gpt-4o-mini,2024-07-18 gpt-4,turbo-2024-04-09 text-embedding-3-small,1 text-embedding-3-large,1 text-embedding-ada-002,2 gpt-4o-realtime-preview2024-12-17 gpt-4o-audio-preview2024-12-17 gpt-4o-mini-realtime-preview2024-12-17 gpt-4o-mini-audio-preview2024-12-17 gpt-4o-transcribe2025-03-20 gpt-4o-mini-tts2025-03-20 gpt-4o-mini-transcribe2025-03-20
australiaeast - - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
德国西中部 - - - - - - - - - - - - - - - -
italynorth - - - - - - - - - - - - - - - - - - - -
日本东部 - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - -
polandcentral - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - -
南印度 - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - -
Swedencentral - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - -
欧洲西部 - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - -

注意

o1-mini 目前可供所有客户用于全局标准部署。

o1-mini 有限访问版本中,选择客户被授予对 o1-preview 的标准(区域)部署访问权限。 目前,不会扩展对 o1-mini 标准(区域)部署的访问。

此表未包括微调区域可用性信息。 有关此信息,请参阅 微调部分

按终结点的标准部署(区域)模型

聊天补全

地区 o1-preview2024-09-12 o1-mini2024-09-12 gpt-4o,2024-05-13 gpt-4o,2024-08-06 gpt-4o2024-11-20 gpt-4o-mini,2024-07-18 gpt-40613 gpt-4,turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613
australiaeast - - - - - -
canadaeast - - - - - -
eastus - -
eastus2 - -
francecentral - - - - - -
日本东部 - - - - - - - - -
northcentralus - -
norwayeast - - - - - - - - - - -
southcentralus - - - -
南印度 - - - - - - - - -
Swedencentral
switzerlandnorth - - - - - - -
uksouth - - - - - - - -
欧洲西部 - - - - - - - - - - -
westus - - -
westus3 - - - -

注意

o1-mini 目前可供所有客户用于全局标准部署。

o1-mini 有限访问版本中,选择客户被授予对 o1-preview 的标准(区域)部署访问权限。 目前,不会扩展对 o1-mini 标准(区域)部署的访问。

GPT-4 和 GPT-4 Turbo 模型可用性

选择客户访问权限

除上述可供所有 Azure OpenAI 客户使用的区域外,一些精选的现有客户还有权访问其他区域中的 GPT-4 版本:

型号 区域
gpt-4 (0314)
gpt-4-32k (0314)
美国东部
法国中部
美国中南部
英国南部
gpt-4 (0613)
gpt-4-32k (0613)
美国东部
美国东部 2
日本东部
英国南部

GPT-3.5 模型

请参阅 模型版本 ,了解 Azure OpenAI 如何处理模型版本升级,以及 如何使用模型 来了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置。

微调模型

注意

gpt-35-turbo - 此模型的微调仅限于一小部分区域,并且基础模型在可用的每个区域中都不可用。

如果在 Azure AI Foundry 项目内部(而不是在某个项目外部)使用 Azure OpenAI 模型,则支持进行微调的区域可能会有所不同。

模型 ID 标准培训区域 全球培训(预览版) 最大请求(标记) 训练数据(上限) 形式
gpt-35-turbo (1106) 美国东部 2
美国中北部
瑞典中部
瑞士西部
- 输入:16,385
输出:4,096
2021 年 9 月 文本转文本
gpt-35-turbo (0125) 美国东部 2
美国中北部
瑞典中部
瑞士西部
- 16,385 2021 年 9 月 文本转文本
gpt-4o-mini (2024-07-18) 美国中北部
瑞典中部
- 输入:128,000
输出:16,384
训练示例上下文长度:65,536
2023 年 10 月 文本转文本
gpt-4o (2024-08-06) 美国东部 2
美国中北部
瑞典中部
- 输入:128,000
输出:16,384
训练示例上下文长度:65,536
2023 年 10 月 文本和视觉转文本
gpt-4.1 (2025-04-14) 美国中北部
瑞典中部
输入:128,000
输出:16,384
训练示例上下文长度:65,536
2024 年 5 月 文本和视觉转文本
gpt-4.1-mini (2025-04-14) 美国中北部
瑞典中部
输入:128,000
输出:16,384
训练示例上下文长度:65,536
2024 年 5 月 文本转文本
gpt-4.1-nano (2025-04-14) 美国中北部
瑞典中部
输入:128,000
输出:16,384
训练示例上下文长度:32,768
2024 年 5 月 文本转文本
o4-mini (2025-04-16) 美国东部 2
瑞典中部
- 输入:128,000
输出:16,384
训练示例上下文长度:65,536
2024 年 5 月 文本转文本

注意

全局训练(公共预览版)为每个令牌提供更实惠的训练,但不提供数据驻留 它目前可用于以下区域中的 Azure OpenAI 资源,即将推出更多区域:

  • 澳大利亚东部
  • 巴西南部
  • 法国中部
  • 德国中西部
  • 意大利北部
  • 日本东部 (无视力支持)
  • 韩国中部
  • 挪威东部
  • 波兰中部
  • 东南亚
  • 西班牙中部
  • 南非北部

助手(预览版)

对于助手,支持的模型和支持的区域的组合。 某些工具和功能需要最新的模型。 以下模型可在助手 API、SDK 和 Azure AI Foundry 中使用。 下表适用于标准部署。 有关预配吞吐量单位(PTU)可用性的信息,请参阅 预配的吞吐量。 列出的模型和区域可用于助手 v1 和 v2。 如果下面列出的区域支持 全局标准模型,则可以使用全局标准模型

地区 gpt-4o,2024-05-13 gpt-4o,2024-08-06 gpt-4o-mini,2024-07-18 gpt-40613 gpt-41106-Preview gpt-40125-Preview gpt-4,turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
日本东部 - - - - - - - - -
norwayeast - - - - - - - - - - -
南印度 - - - - - - - - -
Swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

模型停用

有关模型停用的最新信息,请参阅 模型停用指南

后续步骤