使用微调自定义语音模型

借助自定义语音识别，你可以使用自定义模型进行实时语音转文本翻译、语音翻译和批量听录，从而提高应用程序的语音识别准确度。

使用自己的数据微调 Azure AI 语音基础模型，创建自定义语音模型。你上传数据、测试和训练自定义模型、比较模型之间的准确度，以及将模型部署到自定义终结点。

本文介绍如何使用微调创建自定义语音模型。有关自定义语音识别的详细信息，请参阅自定义语音识别概述文档。

小窍门

可以将自定义语音识别模型从 Speech Studio 引入 Azure AI Foundry 门户。在 Azure AI Foundry 中，可以通过连接到现有语音资源来继续之前的操作。有关连接到现有语音资源的详细信息，请参阅连接到现有语音资源。

开始微调

自定义语音微调包括模型、训练和测试数据集以及部署终结点。每个项目特定于某个区域设置。例如，可以针对美式英语进行微调。

在 Azure AI Foundry 门户中，可以微调一些 Azure AI 服务模型。例如，可以微调某个模型来实现自定义语音识别。每个自定义模型特定于某个区域设置。例如，可以微调美国英语的模型。

转到 Azure AI 语音文档，了解如何继续微调自定义语音模型：

微调后，可以从 “微调 ”页访问自定义语音模型和部署。

若要在 Speech Studio 中创建自定义语音项目，请执行以下步骤：

登录 Speech Studio。
选择要使用的订阅和语音资源。

重要

如果使用音频数据训练自定义模型，请在具有专用硬件的区域中选择服务资源来训练音频数据。有关详细信息，请参阅区域表中的脚注。
选择“自定义语音识别”“创建新项目”。
遵照向导中的说明创建项目。

按名称选择新项目，或选择“转到项目”。然后，应在左侧面板中看到这些菜单项： 语音数据集、 训练自定义模型、 测试模型和 部署模型。