使用微调自定义语音模型

借助自定义语音识别,你可以使用自定义模型进行实时语音转文本翻译、语音翻译和批量听录,从而提高应用程序的语音识别准确度。

使用自己的数据微调 Azure AI 语音基础模型,创建自定义语音模型。 你上传数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。

本文介绍如何使用微调创建自定义语音模型。 有关自定义语音识别的详细信息,请参阅自定义语音识别概述文档。

小窍门

可以将自定义语音识别模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源

开始微调

自定义语音微调包括模型、训练和测试数据集以及部署终结点。 每个项目特定于某个区域设置。 例如,可以针对美式英语进行微调。

Azure AI Foundry 门户中,可以微调一些 Azure AI 服务模型。 例如,可以微调某个模型来实现自定义语音识别。 每个自定义模型特定于某个区域设置。 例如,可以微调美国英语的模型。

  1. 转到 Azure AI Foundry 门户中的项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”“+ 微调”>

    选择微调 Azure AI 服务模型的页面的屏幕截图。

  4. 在向导中,为自定义语音选择“自定义语音”(语音转文本微调)。 然后选择下一步

  5. 输入微调作业的语言、名称和说明。 然后选择 创建

继续微调

转到 Azure AI 语音文档,了解如何继续微调自定义语音模型:

查看已微调的模型

微调后,可以从 “微调 ”页访问自定义语音模型和部署。

  1. 登录 Azure AI Foundry 门户

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”

    可在其中查看已微调的 AI 服务模型的页面的屏幕截图。

若要在 Speech Studio 中创建自定义语音项目,请执行以下步骤:

  1. 登录 Speech Studio

  2. 选择要使用的订阅和语音资源。

    重要

    如果使用音频数据训练自定义模型,请在具有专用硬件的区域中选择服务资源来训练音频数据。 有关详细信息,请参阅区域表中的脚注。

  3. 选择“自定义语音识别”“创建新项目”。

  4. 遵照向导中的说明创建项目。

按名称选择新项目,或选择“转到项目”。 然后,应在左侧面板中看到这些菜单项: 语音数据集训练自定义模型测试模型部署模型