借助自定义语音识别,你可以使用自定义模型进行实时语音转文本翻译、语音翻译和批量听录,从而提高应用程序的语音识别准确度。
使用自己的数据微调 Azure AI 语音基础模型,创建自定义语音模型。 你上传数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。
本文介绍如何使用微调创建自定义语音模型。 有关自定义语音识别的详细信息,请参阅自定义语音识别概述文档。
小窍门
可以将自定义语音识别模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源。
开始微调
自定义语音微调包括模型、训练和测试数据集以及部署终结点。 每个项目特定于某个区域设置。 例如,可以针对美式英语进行微调。
在 Azure AI Foundry 门户中,可以微调一些 Azure AI 服务模型。 例如,可以微调某个模型来实现自定义语音识别。 每个自定义模型特定于某个区域设置。 例如,可以微调美国英语的模型。
转到 Azure AI Foundry 门户中的项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目。
在左侧窗格中选择“微调”。
选择“AI 服务微调”“+ 微调”>。
在向导中,为自定义语音选择“自定义语音”(语音转文本微调)。 然后选择下一步。
输入微调作业的语言、名称和说明。 然后选择 创建。
继续微调
转到 Azure AI 语音文档,了解如何继续微调自定义语音模型:
查看已微调的模型
微调后,可以从 “微调 ”页访问自定义语音模型和部署。
在左侧窗格中选择“微调”。
选择“AI 服务微调”。
若要在 Speech Studio 中创建自定义语音项目,请执行以下步骤:
登录 Speech Studio。
选择要使用的订阅和语音资源。
重要
如果使用音频数据训练自定义模型,请在具有专用硬件的区域中选择服务资源来训练音频数据。 有关详细信息,请参阅区域表中的脚注。
选择“自定义语音识别”“创建新项目”。
遵照向导中的说明创建项目。
按名称选择新项目,或选择“转到项目”。 然后,应在左侧面板中看到这些菜单项: 语音数据集、 训练自定义模型、 测试模型和 部署模型。