你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

可用的 Azure AI Foundry 模型

借助 Azure AI Foundry 模型,可以访问 Azure AI Foundry 中的旗舰模型,以将其用作 API,而无需在基础结构上托管它们。

Microsoft 在“Azure 直接销售的模型”下直接提供了一系列模型,为开发人员构建 AI 应用程序提供了最强大的选择。 我们还通过与业内关键参与者合作,并引入来自合作伙伴和社区的模型来促进模型的发展。

显示 Azure AI Foundry 门户模型目录部分和可用模型的动画。

由 Azure 直接销售的模型

“Azure 直接销售的模型”是 Microsoft 直接提供的一系列旗舰模型。 这些模型不需要与 Azure 市场集成。

Azure OpenAI

Azure AI Foundry Models 中的 Azure OpenAI 提供了一组具有不同功能和价位的不同模型。 在 Azure OpenAI 模型可用性中了解更多详细信息。 这些模型包括:

  • 为处理推理任务和问题解决任务设计的最先进的模型,具有更好的针对性和功能
  • 可以理解和生成自然语言和代码的模型
  • 可以将语音听录和翻译为文本的模型
型号 类型 层级 功能
o3-mini chat-completion 全球标准 - 输入:文本和图像(200,000 个标记)
- 输出:文本(100,000 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本、JSON、结构化输出
o1 chat-completion 全球标准 - 输入:文本和图像(200,000 个标记)
- 输出:文本(100,000 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本、JSON、结构化输出
o1-preview chat-completion 全球标准
标准
- 输入:文本(128,000 个标记)
- 输出:(32,768 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本、JSON、结构化输出
o1-mini chat-completion 全球标准
标准
- 输入:文本(128,000 个标记)
- 输出:(65,536 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本
gpt-4o-realtime-preview 实时 全球标准 - 输入:控制、文本和音频(131,072 个标记)
- 输出:文本和音频(16,384 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本、JSON
gpt-4o chat-completion 全球标准
标准
批次
已预配
全局预配
数据区域
- 输入:文本和图像(131,072 个标记)
- 输出:文本(16,384 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本、JSON、结构化输出
gpt-4o-mini chat-completion 全球标准
标准
批次
已预配
全局预配
数据区域
- 输入:文本、图像和音频(131,072 个标记)
- 输出:(16,384 个标记)
- 语言:enitafesdefridruplukellvzhartrjaswcykoisbnurnethpamrte
- 工具调用:
- 响应格式:文本、JSON、结构化输出
text-embedding-3-large 嵌入 全球标准
标准
已预配
全局预配
- 输入:文本(8,191 个标记)
- 输出:矢量(3,072 dim.)
- 语言:en
text-embedding-3-small 嵌入 全球标准
标准
已预配
全局预配
- 输入:文本(8,191 个标记)
- 输出:矢量(1,536 dim.)
- 语言:en

请参阅 Azure AI Foundry 门户中的此模型集合

DeepSeek

DeepSeek 系列模型包括 DeepSeek-R1,它擅长使用分步训练过程(如语言、科学推理和编码任务)来推理任务。

型号 类型 层级 功能
DeepSeek-R1-0528
chat-completion 全球标准 - 输入: 文本(163,840 个标记)
- 输出: 文本(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本
DeepSeek-V3-0324 chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出: (131,072 个令牌)
- 语言:enzh
- 工具调用:
- 响应格式:文本、JSON
DeepSeek-R1 chat-completion
(具有推理内容)
全球标准 - 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。
DeepSeek-V3
(旧版)
chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出: (131,072 个令牌)
- 语言:enzh
- 工具调用:
- 响应格式:文本、JSON

有关 DeepSeek-R1 的教程,请参阅 教程:Azure AI Foundry 模型中的 DeepSeek-R1 推理模型入门

请参阅 Azure AI Foundry 门户中的此模型集合

微软

Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 一些Microsoft模型作为 合作伙伴和社区的模型提供。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合

型号 类型 层级 功能
MAI-DS-R1 chat-completion
(具有推理内容)
全球标准 - 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。

Mistral人工智能

Mistral AI 提供两类模型:高级模型(包括 Mistral Large 和 Mistral Small)和开放模型(包括 Mistral Nemo)。 一些 Mistral 模型作为 合作伙伴和社区的模型提供。

型号 类型 层级 功能
Codestral-2501 chat-completion 全球标准 - 输入:文本(262,144 个标记)
- 输出:文本(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本

请参阅 Azure AI Foundry 门户中的此模型集合

Meta公司

Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 Meta Llama 4 是 Azure 直接销售的模型的一部分,而 Llama 家族的其余部分则作为 合作伙伴和社区的模型提供。

型号 类型 层级 功能
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion 全球标准 - 输入:文本和图像(1M 个标记)
- 输出: 文本(1M 词元)
- 语言:ar、、enfrdehiiditptestlthvi
- 工具调用:无*
- 响应格式:文本
Llama-3.3-70B-Instruct chat-completion 全球标准 - 输入:文本(128,000 个标记)
- 输出:文本(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本

请参阅 Azure AI Foundry 门户中的此模型集合

xAI

xAI 的 Grok 3 和 Grok 3 微型模型设计为在各种企业领域表现出色。 Grok 3 是 Colossus 数据中心预先训练的非推理模型,专为业务用例(如数据提取、编码和文本摘要)定制,具有特殊的指令跟踪功能。 它支持 131,072 令牌上下文窗口,允许它处理广泛的输入,同时保持一致性和深度,特别善于跨域和语言绘制连接。 另一方面,Grok 3 Mini 是一种轻型推理模型,旨在解决测试时计算的代理、编码、数学和深层科学问题。 它还支持一个 131,072 个令牌的上下文窗口,用于理解代码库和企业文档,并擅长使用工具解决新环境中的复杂逻辑问题,为思维预算可调整的用户检查提供原始推理跟踪。

型号 类型 层级 功能
grok-3 chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出: 文本(131,072 个标记)
- 语言:en
- 工具调用:
- 响应格式: 文本
grok-3-mini chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出: 文本(131,072 个标记)
- 语言:en
- 工具调用:
- 响应格式: 文本

来自合作伙伴和社区的模型

来自合作伙伴和社区的模型可以通过按需付费计费模式(例如 Cohere 模型)进行部署,这些模型由模型提供方提供,但托管在 Microsoft 管理的 Azure 基础设施中,并可通过 Azure AI Foundry 中的 API 进行访问。 模型提供程序定义许可条款并设置其模型的使用价格,而 Azure AI Foundry 则管理托管基础结构。

合作伙伴和社区中的模型通过 Azure 市场提供, 需要其他配置来启用

AI21 实验室

Jamba 家族模型是由 AI21 开发的基于 Mamba 的生产级大型语言模型 (LLM),它采用了 AI21 的混合 Mamba-Transformer 架构。 它是 AI21 混合结构化状态空间模型 (SSM) 转换器 Jamba 模型经过了指令优化的版本。 Jamba 系列模型专用于可靠的商业用途,可提供出色的质量和性能。

型号 类型 层级 功能
AI21-Jamba-1.5-Mini chat-completion 全球标准 - 输入:文本(262,144 个标记)
- 输出:(4,096 个标记)
- 语言:enfresptdearhe
- 工具调用:
- 响应格式:文本、JSON、结构化输出
AI21-Jamba-1.5-Large chat-completion 全球标准 - 输入:文本(262,144 个标记)
- 输出:(4,096 个标记)
- 语言:enfresptdearhe
- 工具调用:
- 响应格式:文本、JSON、结构化输出

请参阅 Azure AI Foundry 门户中的此模型集合

Cohere

Cohere 模型系列包括针对不同用例优化的各种模型,其中包括会话补全和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、总结和问答。

型号 类型 层级 功能
Cohere-command-r-plus-08-2024 chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用:
- 响应格式:文本、JSON
Cohere-command-r-08-2024 chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用:
- 响应格式:文本、JSON
Cohere-command-r-plus
(已弃用)
chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用:
- 响应格式:文本、JSON
Cohere-command-r
(已弃用)
chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用:
- 响应格式:文本、JSON
Cohere-embed-v3-english 嵌入
image-embeddings
全球标准 - 输入:文本(512 个标记)
- 输出:矢量(1,024 dim.)
- 语言:en
Cohere-embed-v3-多语言 嵌入
image-embeddings
全球标准 - 输入:文本(512 个标记)
- 输出:矢量(1,024 dim.)
- 语言:en、、fresitdept-brjakozh-cnar

请参阅 Azure AI Foundry 门户中的此模型集合

Core42

Core42 包含阿拉伯语和英语的自回归双语 LLM,在阿拉伯语中具有最先进的功能。

型号 类型 层级 功能
jais-30b-chat chat-completion 全球标准 - 输入:文本(8,192 个标记)
- 输出:(4,096 个标记)
- 语言:en 和 ar
- 工具调用:
- 响应格式:文本、JSON

请参阅 Azure AI Foundry 门户中的此模型集合

Meta公司

Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围扩展到包括:

  • 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
  • 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
  • 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
型号 类型 层级 功能
Llama-3.2-11B-Vision-Instruct chat-completion 全球标准 - 输入:文本和图像(128,000 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本
Llama-3.2-90B-Vision-Instruct chat-completion 全球标准 - 输入:文本和图像(128,000 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本
Meta-Llama-3.1-405B-Instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Meta-Llama-3.1-70B-Instruct
(已弃用)
chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Meta-Llama-3.1-8B-Instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Meta-Llama-3-70B-Instruct
(已弃用)
chat-completion 全球标准 - 输入:文本(8,192 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本
Meta-Llama-3-8B-Instruct
(已弃用)
chat-completion 全球标准 - 输入:文本(8,192 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本

请参阅 Azure AI Foundry 门户中的此模型集合

微软

Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合

型号 类型 层级 功能
MAI-DS-R1 chat-completion
(具有推理内容)
全球标准 - 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。
Phi-4-mini-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:arzhcsdanlenfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Phi-4-multimodal-instruct chat-completion 全球标准 - 输入: 文本、图像和音频(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:arzhcsdanlenfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Phi-4 chat-completion 全球标准 - 输入:文本(16,384 个标记)
- 输出:(16,384 个标记)
- 语言:enarbncsdadeelesfafifrguhahehihuiditjajvknkomlmrnlnoorpaplpsptrorusvswtatethtltrukurviyo、及zh
- 工具调用:
- 响应格式:文本
Phi-3.5-mini-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:enarzhcsdanlfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Phi-3.5-vision-instruct chat-completion 全球标准 - 输入:文本和图像(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3.5-MoE-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:enarzhcsdanlfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Phi-3-mini-128k-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3-mini-4k-instruct chat-completion 全球标准 - 输入:文本(4,096 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3-small-8k-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3-medium-128k-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3-medium-4k-instruct chat-completion 全球标准 - 输入:文本(4,096 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Phi-3-small-128k-instruct chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本

请参阅 Azure AI Foundry 门户中的Microsoft模型集合

Mistral人工智能

Mistral AI 提供两类模型:高级模型(包括 Mistral Large 和 Mistral Small)和开放模型(包括 Mistral Nemo)。

型号 类型 层级 功能
Mistral-small-2503 chat-completion 全球标准 - 输入:文本(32,768 个标记)
- 输出:文本(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用:
- 响应格式:文本、JSON
Mistral-Large-2411 chat-completion 全球标准 - 输入:文本(128,000 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、frdeesitzhjakopt、和 nlpl
- 工具调用:
- 响应格式:文本、JSON
米尼斯特拉尔-3B chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用:
- 响应格式:文本、JSON
Mistral-Nemo chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、frdeesitzhjakopt、和 nlpl
- 工具调用:
- 响应格式:文本、JSON
Mistral-large-2407
(已弃用)
chat-completion 全球标准 - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:en、、frdeesitzhjakopt、和 nlpl
- 工具调用:
- 响应格式:文本、JSON
Mistral-small
(已弃用)
chat-completion 全球标准 - 输入:文本(32,768 个标记)
- 输出:文本(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用:
- 响应格式:文本、JSON
Mistral-large
(已弃用)
chat-completion 全球标准 - 输入:文本(32,768 个标记)
- 输出:(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用:
- 响应格式:文本、JSON

请参阅 Azure AI Foundry 门户中的此模型集合

NTT 数据

tsuzumi 是自动回归语言优化转换器。 优化版本使用监督式微调 (SFT)。 tsuzumi 可以高效地处理日语和英语。

型号 类型 层级 功能
tsuzumi-7b chat-completion 全球标准 - 输入:文本(8,192 个标记)
- 输出:文本(8,192 个标记)
- 语言:enjp
- 工具调用:
- 响应格式:文本

开放和受保护的模型

Azure AI 模型目录从更大的提供商范围提供更大的模型选择。 与提供模型为 API 的 Azure AI Foundry 模型相反,这些模型可能需要在基础结构上托管它们,包括创建 AI 中心和项目,并提供用于托管模型的基础计算配额。

这些模型可以是开放访问或 IP 保护。 在这两种情况下,必须在 Azure AI Foundry 的托管计算产品/服务中部署它们。

后续步骤