比较 Microsoft 的机器学习产品和技术

了解 Microsoft 的机器学习产品和技术。 比较各个选项可帮助你选择如何最有效地构建、部署和管理机器学习解决方案。

基于云的机器学习产品

为 Azure 云中的机器学习提供了以下选项。

云选项 描述 功能和用途
Azure 机器学习 用于机器学习的托管平台 使用 Python 和 CLI 在 Azure 上使用预先训练的模型,或训练、部署和管理模型。 机器学习包括自动化机器学习(AutoML)、提示流、模型目录和 MLflow 集成等功能。 可以在生产阶段跟踪和了解模型性能。
Microsoft Fabric 统一的分析平台 通过使用综合平台为数据专业人员(包括数据工程师、数据科学家和业务分析师)集成各种服务和工具,管理整个数据生命周期,从引入到见解。
Azure AI 服务 通过 REST API 和 SDK 实现的预生成 AI 功能 使用标准编程语言生成智能应用程序。 这些语言调用提供推理的 API。 尽管最好拥有机器学习和数据科学专业知识,但没有这些技能的工程团队也可以采用此平台。
Azure SQL 托管实例机器学习服务 适用于 SQL 的数据库内机器学习 在 SQL 托管实例中训练和部署模型。
Azure Synapse Analytics 中的机器学习 使用机器学习的分析服务 在 Azure Synapse Analytics 中训练和部署模型。
Azure Databricks 基于 Apache Spark 的分析平台 通过与开源机器学习库和 MLflow 平台集成来生成和部署模型和数据工作流。

本地机器学习产品

以下选项可用于本地机器学习。 本地服务器还可以在云中的虚拟机(VM)中运行。

本地产品 描述 功能和用途
SQL Server 机器学习服务 适用于 SQL 的数据库内机器学习 使用 Python 和 R 脚本在 SQL Server 中训练和部署模型。

开发平台和工具

为机器学习提供了以下开发平台和工具。

平台或工具 描述 功能和用途
Azure AI Foundry 门户 适用于 AI 和机器学习方案的统一开发环境 开发、评估和部署 AI 模型和应用程序。 Azure AI Foundry 门户可跨各种 Azure AI 服务促进协作和项目管理。 你甚至可以将其用作多个负载工作团队的通用环境。
Azure 机器学习工作室 用于机器学习的协作型拖放式工具 使用最少的编码生成、测试和部署预测分析解决方案。 机器学习工作室支持各种机器学习算法和 AI 模型。 它提供用于数据准备、模型训练和评估的工具。
Azure Data Science Virtual Machine 包含预安装的数据科学工具的 VM 映像 将预配置环境与 Jupyter、R 和 Python 等工具配合使用,在自己的 VM 上开发机器学习解决方案。
Microsoft ML.NET 开源的跨平台机器学习 SDK 开发适用于 .NET 应用程序的机器学习解决方案。
适用于 Windows 应用的 AI 适用于在 Windows 设备中评估已训练的模型的推理引擎 使用 Windows 机器学习(WinML)直接机器学习(DirectML) 等组件将 AI 功能集成到 Windows 应用程序中,以便进行本地实时 AI 模型评估和硬件加速。
SynapseML 适用于 Apache Spark 的开源分布式机器学习和微服务框架 创建和部署适用于 Scala 和 Python 的可缩放机器学习应用程序。
适用于 Azure Data Studio 的机器学习扩展 适用于 Azure Data Studio 的开源跨平台机器学习扩展 管理包、导入机器学习模型、进行预测,并创建笔记本来运行 SQL 数据库的试验。

Azure 机器学习

机器学习 是一项完全托管的云服务,可用于大规模训练、部署和管理机器学习模型。 它完全支持开源技术,因此可以使用数以万计的开源 Python 包,例如 TensorFlow、PyTorch 和 scikit-learn。

还可以使用丰富的工具,例如 计算实例Jupyter 笔记本用于 Visual Studio Code 的 Azure 机器学习(VS Code)扩展。 适用于 VS Code 的机器学习扩展是一个免费扩展,可用于管理 VS Code 中的资源和模型训练工作流和部署。 机器学习具备能够自动生成和优化模型的功能,提高了该过程的轻松性、效率和准确性。

使用 Python SDK、Jupyter 笔记本、R 和 CLI 实现云规模机器学习。 如果需要低代码或无代码选项,请使用工作室中的 设计器 。 设计器使用预生成的机器学习算法轻松快速地生成、测试和部署模型。 此外,还可以将机器学习与 Azure DevOps 和 GitHub Actions 集成,以便持续集成和持续部署(CI/CD)机器学习模型。

机器学习功能 描述
类型 基于云的机器学习解决方案
支持的语言 -Python
- R
机器学习阶段 - 数据准备
- 模型训练
-部署
- MLOps 或管理
- 负责任的 AI
主要优势 - Code First (SDK)、工作室和拖放式设计器 Web 界面创作选项
- 集中管理脚本和运行历史记录,以便轻松比较模型版本
- 轻松将模型部署到云或边缘设备
- 可缩放的机器学习模型的训练、部署和管理
考虑 需要对模型管理模型有一定的了解。

Azure AI 服务

AI 服务 是一套全面的预生成 API,可帮助开发人员和组织快速创建智能的市场就绪应用程序。 这些服务提供现用且可自定义的 API 和 SDK,使应用能够以最少的代码查看、听到、说话、理解和解释用户需求。 这些功能使数据集或数据科学专业知识无需训练模型。 可以向应用添加智能功能,例如:

使用 AI 服务跨设备和平台开发应用。 API 不断改进,易于设置。

AI 服务功能 描述
类型 用于生成智能应用程序的 API
支持的语言 多个选项,具体取决于服务。 标准选项包括 C#、Java、JavaScript 和 Python。
机器学习阶段 部署
主要优势 - 使用通过 REST API 和 SDK 提供的预训练模型生成智能应用程序
- 将各种模型用于具有视觉、语音、语言和决策功能的自然通信方法
- 不需要或最少的机器学习或数据科学专业知识
- API 可缩放且灵活
- 可以从各种模型中进行选择

SQL 机器学习

SQL 机器学习 为本地和云中的关系数据添加了 Python 和 R 中的统计分析、数据可视化和预测分析。 当前的平台和工具包括:

需要对 SQL 中的关系数据使用内置 AI 和预测分析时,可以使用 SQL 机器学习。

SQL 机器学习功能 描述
类型 关系数据的本地预测分析
支持的语言 -蟒
- R
- SQL
机器学习阶段 - 数据准备
- 模型训练
-部署
主要优势 在数据库函数中封装预测逻辑。 此过程使包含数据层逻辑变得容易。
考虑 假设使用 SQL 数据库作为应用程序的数据层。

Azure AI Foundry

Azure AI Foundry 是一个统一的平台,可用于开发和部署生成式 AI 应用程序和 Azure AI API。 它提供了一组全面的 AI 功能、简化的用户界面和代码优先体验。 这些功能使其成为用于构建、测试、部署和管理智能解决方案的综合平台。

Azure AI Foundry 使用 Azure AI 产品/服务帮助开发人员和数据科学家高效地创建和部署生成式 AI 应用程序。 它强调负责任的 AI 开发和嵌入公平性、透明度和问责原则。 该平台包括用于偏差检测、可解释性和隐私保留机器学习的工具。 这些工具有助于确保 AI 模型强大、可信且符合法规要求。

作为 azure 生态系统Microsoft的一部分,Azure AI Foundry 提供强大的工具和服务,以满足各种 AI 和机器学习需求,包括自然语言处理和计算机视觉。 它与其他 Azure 服务的集成有助于确保无缝的可伸缩性和性能,这使得它成为企业的理想选择。

Azure AI Foundry 门户通过提供共享工作区、版本控制和集成开发环境等功能来促进协作和创新。 通过集成常用的开源框架和工具,Azure AI Foundry 加快了开发过程,使组织能够推动创新,并在竞争激烈的 AI 环境中保持领先。

Azure AI Foundry 功能 描述
类型 适用于 AI 的统一开发环境
支持的语言 仅 Python
机器学习阶段 - 数据准备
- 部署(模型即服务(MaaS))
主要优势 - 跨各种 AI 服务促进协作和项目管理
- 提供用于生成、训练和部署 AI 模型的综合工具
- 强调负责的人工智能,通过提供偏见检测、可解释性以及保护隐私的机器学习工具
- 支持与常用的开源框架和工具集成
- 包括用于创建和管理基于提示的工作流的提示流。提示流简化了由语言模型驱动的 AI 应用程序的开发周期。

Azure 机器学习工作室

Azure 机器学习工作室 是一种协作式拖放工具,用于在数据上生成、测试和部署预测分析解决方案。 它专为数据科学家、数据工程师和商业分析师设计。 机器学习工作室支持各种机器学习算法和工具,用于数据准备、模型训练和评估。 它还提供一个可视化界面,用于连接交互式画布上的数据集和模块。

机器学习工作室功能 描述
类型 用于机器学习的协作型拖放式工具
支持的语言 - Python编程语言
- R
- Scala
- Java (有限体验)
机器学习阶段 - 数据准备
- 模型训练
-部署
主要优势 - 无需编码即可生成机器学习模型
- 支持各种机器学习算法和工具,用于数据准备、模型训练和评估
- 提供用于连接交互式画布上的数据集和模块的可视界面
- 支持与机器学习集成以执行高级机器学习任务

有关机器学习工作室和 Azure AI Foundry 门户的全面比较,请参阅 Azure AI Foundry 门户或机器学习工作室。 下表总结了它们之间的主要差异:

类别 功能 Azure AI Foundry 门户 机器学习工作室
数据存储 存储解决方案 是(云文件系统、OneLake、Azure 存储)
数据准备 数据集成 是(Azure Blob 存储、OneLake、Azure Data Lake Storage) 是(使用 Azure 存储帐户复制和装载)
发展 代码优先工具 是 (VS Code) 是(笔记本、Jupyter、VS Code、R Studio)
语言 支持的语言 仅 Python Python、R、Scala、Java
训练 自动化 ML 是(回归、分类、预测、CV、NLP)
计算目标 训练计算 无服务器 MaaS、提示流) Spark 群集、机器学习群集、Azure Arc
生成式 AI 语言模型目录 是(Azure OpenAI、Hugging Face、元) 是(Azure OpenAI、Hugging Face、元)
部署 实时和批处理服务 实时 (MaaS) 批处理终结点,Azure Arc
统辖 负责任的 AI 工具 是(负责任 AI 仪表板)

Microsoft Fabric

Fabric 是一个端到端的统一分析平台,汇集了组织所需的所有数据和分析工具。 它集成了各种服务和工具,为数据专业人员(包括数据工程师、数据科学家和业务分析师)提供无缝体验。 Fabric 提供数据集成、数据工程、数据仓库、数据科学、实时分析和商业智能的功能。

如果需要全面的平台来管理从引入到见解的整个数据生命周期,请使用 Fabric。

面料特性 描述
类型 统一的分析平台
支持的语言 - Python编程语言
- R
- SQL
- Scala
机器学习阶段 - 数据准备
- 模型训练
-部署
- 实时分析
主要优势 - 适用于所有数据和分析需求的统一平台
- 与其他Microsoft服务无缝集成
- 可缩放且灵活
- 支持各种数据和分析工具
- 促进组织中不同角色之间的协作
- 从引入到见解的端到端数据生命周期管理
- 实时分析和商业智能功能
- 机器学习模型训练和部署支持
- 与常用的机器学习框架和工具集成
- 用于数据准备和特征工程的工具
- 实时机器学习推理和分析

Azure Data Science Virtual Machine

Azure Data Science Virtual Machine 是 Microsoft Azure 云上的自定义 VM 环境。 它适用于 Windows 和 Linux Ubuntu 的版本。 环境专门用于数据科学任务和机器学习解决方案开发。 它具有许多常用的数据科学函数、机器学习框架和其他预安装和预配置工具,以便你可以快速开始构建用于高级分析的智能应用程序。

如果需要在单个节点上运行或托管作业,或者需要在单个计算机上远程扩展处理,请使用 Data Science VM。

Azure Data Science Virtual Machine 功能 描述
类型 用于数据科学的自定义 VM 环境
主要优势 - 缩短了安装、管理和排查数据科学工具和框架问题的时间
- 包括常用工具和框架的最新版本
- 包括高度可缩放的图像和图形处理单元(GPU)功能,用于密集的数据建模
考虑 - VM 脱机时无法访问。
- 运行 VM 会产生 Azure 费用,因此应确保它仅在需要时才运行。

Azure Databricks

Azure Databricks 是基于 Apache Spark 的分析平台,针对 Microsoft Azure 云平台进行优化。 Azure Databricks 与 Azure 集成,可提供一键式设置、简化的工作流和交互式工作区,使数据科学家、数据工程师和业务分析师能够协作。 在基于 Web 的 Notebook 中使用 Python、R、Scala 和 SQL 代码可以查询、可视化数据以及为其建模。

若要在 Apache Spark 上协作构建机器学习解决方案,请使用 Azure Databricks。

Azure Databricks 功能 描述
类型 基于 Apache Spark 的分析平台
支持的语言 - Python
- R
- Scala
- SQL
机器学习阶段 - 数据准备
- 数据预处理
- 模型训练
- 模型优化
- 模型推理
-管理
-部署
主要优势 - 一键式设置和简化的工作流,方便使用
- 用于协作的交互式工作区
- 与 Azure 无缝集成
- 处理大型数据集和密集型计算的可伸缩性
- 支持各种语言并与常用工具集成

ML.NET

ML.NET 是开源跨平台机器学习框架。 使用 ML.NET 生成自定义机器学习解决方案并将其集成到 .NET 应用程序中。 ML.NET 提供与 TensorFlow 和 ONNX 等常用框架的各种互作性,用于训练和评分机器学习和深度学习模型。 对于训练图像分类模型等资源密集型任务,可以使用 Azure 在云中训练模型。

想要将机器学习解决方案集成到 .NET 应用程序时,可以使用 ML.NET。 在API模型生成器CLI之间选择,以获取代码优先或低代码体验。

ML.NET 功能 描述
类型 使用 .NET 开发自定义机器学习应用程序的开源跨平台框架
支持的语言 - C#
- F#
机器学习阶段 - 数据准备
-训练
-部署
主要优势 - 不需要数据科学或机器学习体验
- 熟悉的语言和工具,如 Visual Studio 和 VS Code
- 部署运行 .NET 的应用程序
- 可扩展且可缩放的设计
- 本地优先体验
- 用于自动化机器学习任务的 AutoML

Windows 应用的人工智能

使用 适用于 Windows 应用的 AI 将 AI 功能集成到 Windows 应用程序中,使用 WinML 和 DirectML 功能提供本地、实时 AI 模型评估和硬件加速。 WinML 允许开发人员将训练的机器学习模型直接集成到其 Windows 应用程序中。 它有助于对模型进行本地实时评估,并支持强大的 AI 功能,而无需云连接。

DirectML 是用于运行机器学习模型的高性能硬件加速平台。 它使用 DirectX API 跨各种硬件(包括 GPU 和 AI 加速器)提供优化的性能。

若要在 Windows 应用程序中使用经过训练的机器学习模型,请使用适用于 Windows 应用的 AI。

适用于 Windows 应用的 AI 功能 描述
类型 适用于在 Windows 设备中评估已训练的模型的推理引擎
支持的语言 - C#/C++
- JavaScript
机器学习阶段 - 数据准备
- 模型训练
-部署
主要优势 - 本地实时 AI 模型评估
- 跨各种硬件类型的高性能 AI 处理,包括 CPU、GPU 和 AI 加速器
- 跨 Windows 硬件的一致行为和性能

SynapseML

SynapseML(以前称为 MMLSpark)是一个开源库,可简化大规模可缩放的机器学习管道的创建。 SynapseML 为各种机器学习任务(例如文本分析、视觉和异常情况检测)提供 API。 SynapseML 是基于 Apache Spark 分布式计算框架构建的,与 SparkML 和 MLlib 库共享相同的 API,因此可以将 SynapseML 模型无缝嵌入到现有的 Apache Spark 工作流中。

SynapseML 向 Spark 生态系统添加了许多深度学习和数据科学工具,包括 Spark 机器学习管道与轻型梯度提升计算机 (LightGBM)本地可解释模型无关解释OpenCV 的无缝集成。 可以使用这些工具在任何 Spark 群集(如 Azure DatabricksAzure Cosmos DB)上创建功能强大的预测模型。

SynapseML 还为 Spark 生态系统提供网络功能。 借助 HTTP on Spark 项目,用户可以将任何 Web 服务嵌入到其 SparkML 模型。 此外,SynapseML 还提供易于使用的工具,用于大规模协调 AI 服务 。 对于生产级部署,Spark 服务项目可实现由 Spark 群集支持的高吞吐量和子延迟 Web 服务。

SynapseML 功能 描述
类型 适用于 Apache Spark 的开源分布式机器学习和微服务框架
支持的语言 - Scala
-爪哇岛
- Python编程语言
- R
- .NET
机器学习阶段 - 数据准备
- 模型训练
-部署
主要优势 - 可伸缩性
- 流式处理和服务兼容
- 高容错
考虑 需要 Apache Spark

贡献者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

主要作者:

若要查看非公开的LinkedIn个人资料,请登录LinkedIn。

后续步骤