微調整を使用して音声モデルをカスタマイズする

2025-05-20

Custom Speech を使用すると、リアルタイムの音声テキスト変換、音声翻訳、バッチ文字起こし用のカスタムモデルを使用して、アプリケーションの音声認識の精度を向上させることができます。

独自のデータを使用して Azure AI Speech ベースモデルを微調整することで、カスタム音声モデルを作成します。データのアップロード、カスタムモデルのテストとトレーニング、モデル間の正確性の比較、カスタムエンドポイントへのモデルのデプロイを行うことができます。

この記事では、微調整を使用してカスタム音声モデルを作成する方法について説明します。 Custom Speech の詳細については、Custom Speech の概要に関するドキュメントを参照してください。

ヒント

カスタム音声モデルを Speech Studio から Azure AI Foundry ポータルに取り込むことができます。 Azure AI Foundry では、既存のスピーチリソースに接続して、中断したところから再開できます。既存の Speech リソースへの接続の詳細については、既存の Speech リソースへの接続に関する記事を参照してください。

微調整を開始する

カスタム音声の微調整には、モデル、トレーニングとテストのデータセット、デプロイエンドポイントが含まれます。各プロジェクトはロケール別になっています。たとえば、米国では英語を微調整できます。

Azure AI Foundry ポータルでは、一部の Azure AI サービスモデルを微調整できます。たとえば、Custom Speech のモデルを微調整できます。各カスタムモデルは、ロケールに固有です。たとえば、米国の英語のモデルを微調整できます。

Azure AI Foundry ポータルでプロジェクトに移動します。プロジェクトを作成する必要がある場合は、「Azure AI Foundry プロジェクトの作成」を参照してください。
左側のペインから [微調整] を選択します。
[AI サービスの微調整]>[+ 微調整] を選択します。
ウィザードで、音声カスタマイズ（音声認識の微調整）を選択します。 [次へ] を選択します。
微調整のタスクの言語、名前、説明を入力します。 [作成] を選択します。

微調整を続行する

カスタム音声モデルの微調整を続行する方法については、Azure AI Speech のドキュメントを参照してください。

微調整されたモデルを表示する

微調整が完了したら、[ 微調整 ] ページからカスタム音声モデルとデプロイにアクセスできます。

Azure AI Foundry ポータルにサインインします。
左側のペインから [微調整] を選択します。
[AI サービスの微調整] を選択します。

Speech Studio でカスタム音声プロジェクトを作成するには、次の手順に従います。

Speech Studio にサインインします。
使用するサブスクリプションと Speech リソースを選択します。

重要

オーディオデータを使用してカスタムモデルをトレーニングする場合は、オーディオデータをトレーニングするための専用ハードウェアがあるリージョンのサービスリソースを選択します。詳細については、リージョンテーブルの脚注を参照してください。
[Custom Speech]>[新しいプロジェクトを作成する] を選択します。
ウィザードの手順に従ってプロジェクトを作成します。

新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。その後、左側のパネルに、 音声データセット、 カスタムモデルのトレーニング、 モデルのテスト、モデル のデプロイというメニュー項目が表示されます。

次の方法で共有

微調整を使用して音声モデルをカスタマイズする

微調整を開始する

微調整を続行する

微調整されたモデルを表示する

関連コンテンツ

フィードバック

その他のリソース