次の方法で共有


微調整を使用して音声モデルをカスタマイズする

Custom Speech を使用すると、リアルタイムの音声テキスト変換、音声翻訳、バッチ文字起こし用のカスタム モデルを使用して、アプリケーションの音声認識の精度を向上させることができます。

独自のデータを使用して Azure AI Speech ベース モデルを微調整することで、カスタム音声モデルを作成します。 データのアップロード、カスタム モデルのテストとトレーニング、モデル間の正確性の比較、カスタム エンドポイントへのモデルのデプロイを行うことができます。

この記事では、微調整を使用してカスタム音声モデルを作成する方法について説明します。 Custom Speech の詳細については、Custom Speech の概要に関するドキュメントを参照してください。

ヒント

カスタム音声モデルを Speech Studio から Azure AI Foundry ポータルに取り込むことができます。 Azure AI Foundry では、既存のスピーチリソースに接続して、中断したところから再開できます。 既存の Speech リソースへの接続の詳細については、既存の Speech リソースへの接続に関する記事を参照してください。

微調整を開始する

カスタム音声の微調整には、モデル、トレーニングとテストのデータセット、デプロイ エンドポイントが含まれます。 各プロジェクトはロケール別になっています。 たとえば、米国では英語を微調整できます。

Azure AI Foundry ポータルでは、一部の Azure AI サービス モデルを微調整できます。 たとえば、Custom Speech のモデルを微調整できます。 各カスタム モデルは、ロケールに固有です。 たとえば、米国の英語のモデルを微調整できます。

  1. Azure AI Foundry ポータルでプロジェクトに移動します。 プロジェクトを作成する必要がある場合は、「Azure AI Foundry プロジェクトの作成」を参照してください。

  2. 左側のペインから [微調整] を選択します。

  3. [AI サービスの微調整]>[+ 微調整] を選択します。

    Azure AI サービス モデルの微調整を選択するページのスクリーンショット。

  4. ウィザードで、音声カスタマイズ(音声認識の微調整)を選択します。 [次へ] を選択します。

  5. 微調整のタスクの言語、名前、説明を入力します。 [作成] を選択します。

微調整を続行する

カスタム音声モデルの微調整を続行する方法については、Azure AI Speech のドキュメントを参照してください。

微調整されたモデルを表示する

微調整が完了したら、[ 微調整 ] ページからカスタム音声モデルとデプロイにアクセスできます。

  1. Azure AI Foundry ポータルにサインインします。

  2. 左側のペインから [微調整] を選択します。

  3. [AI サービスの微調整] を選択します。

    微調整された AI サービス モデルを表示できるページのスクリーンショット。

Speech Studio でカスタム音声プロジェクトを作成するには、次の手順に従います。

  1. Speech Studio にサインインします。

  2. 使用するサブスクリプションと Speech リソースを選択します。

    重要

    オーディオ データを使用してカスタム モデルをトレーニングする場合は、オーディオ データをトレーニングするための専用ハードウェアがあるリージョンのサービス リソースを選択します。 詳細については、リージョン テーブルの脚注を参照してください。

  3. [Custom Speech]>[新しいプロジェクトを作成する] を選択します。

  4. ウィザードの手順に従ってプロジェクトを作成します。

新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。 その後、左側のパネルに、 音声データセットカスタム モデルのトレーニングモデルのテスト、モデル のデプロイというメニュー項目が表示されます。