你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

创建专业声音项目

只需准备好几个音频文件和关联的听录内容即可开始。 查看自定义语音是否支持 你的语言区域

开始微调

Azure AI Foundry 门户中,可以微调一些 Azure AI 服务模型。 例如,可以微调专业语音模型。

若要微调专业语音模型,请执行以下步骤:

  1. Azure AI Foundry 门户中转到 Azure AI Foundry 项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”“+ 微调”>

    选择微调 Azure AI 服务模型的页面的屏幕截图。

  4. 在向导中,选择“自定义语音”(专业语音微调)。

  5. 选择“下一步”。

  6. 请遵循向导提供的说明来创建您的微调工作区。

继续微调

转到 Azure AI 语音文档,了解如何继续微调专业语音模型:

查看已微调的模型

微调后,可以从 “微调 ”页访问自定义语音模型和部署。

  1. 登录 Azure AI Foundry 门户

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”。 可以查看微调任务的状态和已创建的模型。

    用于查看优化 AI 服务模型的页面屏幕截图。

后续步骤

自定义语音(如数据、模型、测试和终结点)的内容将组织到 Speech Studio 中的项目中。 每个项目特定于某个国家/地区和语言,以及要创建的声音所属的性别。 例如,对于呼叫中心的聊天机器人,可以创建使用美式英语的女性声音项目。

只需准备好几个音频文件和关联的听录内容即可开始。 查看自定义语音是否支持 你的语言区域

开始微调

若要微调专业语音模型,请执行以下步骤:

  1. 登录 Speech Studio

  2. 选择要使用的订阅和语音资源。

    重要

    自定义语音培训目前仅在某些区域中可用。 在受支持区域中训练声音模型后,可以根据需要将其复制到另一个区域中的语音资源。 有关详细信息,请参阅区域表中的脚注。

  3. 选择“定制声音”“创建项目”。>

  4. 选择“神经网络定制声音专业版”“下一步”。>

  5. 遵照向导中的说明创建项目。

按名称选择新项目,或选择“转到项目”。 你会在左侧面板中看到以下菜单项:“设置发音人”、“准备训练数据”、“训练模型”和“部署模型”

后续步骤

专业声音项目包含发音人同意声明、训练数据集、声音模型和终结点。

每个项目特定于某个国家/地区和语言,以及要创建的声音所属的性别。 例如,对于呼叫中心的聊天机器人,可以创建使用美式英语的女性声音项目。

创建项目

若要创建专业语音项目,请使用自定义语音 API 的 Projects_Create 操作。 根据以下说明构造请求正文:

  • 将所需的 kind 属性设置为 ProfessionalVoice。 以后无法更改此类型。
  • (可选)设置项目说明的 description 属性。 之后可更改此项目说明。

使用 URI 发出 HTTP PUT 请求,如以下 Projects_Create 示例所示。

  • YourResourceKey 替换为语音资源密钥。
  • YourResourceRegion 替换为你所在的语音资源区域。
  • ProjectId 替换为所选的项目 ID。 该 ID 区分大小写,并且在语音资源中必须是唯一的。 该 ID 将在项目的 URI 中使用,并且以后无法更改。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"

你应该会收到以下格式的响应正文:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

在后续 API 请求中使用项目 id添加发音人同意创建训练集

后续步骤