Von Bedeutung
英語以外の翻訳は便宜上のみ提供されています。 バインドのバージョンについては、このドキュメントの EN-US
バージョンを参照してください。
この記事では、カスタム テキスト分類によってデータがどのように処理されるかについて、大まかに詳しく説明します。 お客様は、お客様の使用とこのテクノロジの実装に責任を負うことを忘れないでください。これには、お客様に適用されるすべての法令への準拠が含まれます。 たとえば、次の手順を実行するのはユーザーの責任です。
- アプリケーションの規制上の義務を満たすために、カスタム テキスト分類サービスによってデータが処理および格納される場所を理解します。
- カスタム テキスト分類モデルを構築するための基礎として使用されるデータセット内のコンテンツに必要なすべてのライセンス、所有権、またはその他のアクセス許可があることを確認します。
お客様の管轄区域で適用されるすべての法令および規制を遵守することは、お客様の責任です。
カスタム テキスト分類ではどのようなデータが処理されますか?
カスタム テキスト分類では、次のデータが処理されます。
ユーザーのデータセットとタグ ファイル: カスタム テキスト分類プロジェクトを作成するための前提条件として、ユーザーは自分のデータセットを Azure Blob Storage コンテナーにアップロードする必要があります。 タグ ファイルは、ユーザーのタグ付けされたデータとクラスへの参照を含む JSON 形式のファイルです。 ユーザーは、独自のタグを持ち込むか、 Language Studio の UI エクスペリエンスを使用してデータにタグを付けることができます。 どちらの場合も、タグ付けされたデータとクラスを含むタグ ファイルは、トレーニングに不可欠です。
ユーザーのデータセットはトレーニング セットとテスト セットに分割されます。この分割は、開発者がタグ ファイルで事前に定義することも、トレーニング中にランダムに選択することもできます。 トレーニング セットとタグ ファイルは、トレーニング中に処理され、カスタム テキスト分類モデルが作成されます。 テスト セットは、後でトレーニング済みのモデルによって処理され、そのパフォーマンスが評価されます。
カスタム テキスト分類モデル: モデルをトレーニングするユーザーの要求に基づいて、カスタム テキスト分類は、指定されたタグ付きデータを処理してトレーニング済みのモデルを出力します。 ユーザーは、新しいモデルをトレーニングするか、既存のモデルを上書きすることを選択できます。 その後、トレーニング済みのモデルがサービス側に格納され、モデル評価の処理に使用されます。 開発者は、モデルのパフォーマンスに満足した後、そのモデルを使用目的でデプロイするよう依頼します。 デプロイされたモデルはサービス側にも格納されます。これは、Analyze API を使用してユーザーの予測要求を処理するために使用されます。
分類のために送信されるデータ: このデータは、カスタム機械学習モデルによってテキスト分類用に処理される Analyze API を介して顧客のクライアント アプリケーションから送信されるユーザーのテキストです。 処理されたデータの出力には、予測されたクラスとその信頼度スコアが含まれます。 この出力は、ユーザーの要求を満たすアクションを実行するためにクライアントのアプリケーションに返されます。
カスタム テキスト分類では、機械学習モデルを改善したり、製品の改善のために顧客データを収集したり保存したりすることはありません。 サービス監視の目的で、使用されている API や各サブスクリプションとリソースからの呼び出しの数などの集計テレメトリを使用します。
カスタム テキスト分類ではデータはどのように処理されますか?
次の図は、データの処理方法を示しています。
データはどのように保持され、どのような顧客コントロールを利用できますか?
カスタム テキスト分類は、一般データ保護規則 (GDPR) を目的としたデータ プロセッサです。 GDPR ポリシーに準拠して、カスタム テキスト分類ユーザーは、 Language Studio を介して、または言語 API を使用してプログラムを使用して、ユーザー コンテンツを表示、エクスポート、または削除するためのフル コントロールを持ちます。
データは、Azure ストレージ アカウントにのみ格納されます。 カスタム テキスト分類は、トレーニング中にそこから読み取るアクセス権のみを持っています。
顧客コントロールには次のものが含まれます。
- モデルをトレーニングするための前提条件としてユーザーによって提供されるタグ付けされたデータは、作成時にプロジェクトに接続されている顧客の Azure Storage アカウントに保存されます。 お客様は、Language Studio を使用していつでもタグを編集または削除できます。
- カスタム テキスト分類プロジェクトのメタデータは、顧客がプロジェクトを削除するまでサービス側に格納されます。 プロジェクトのメタデータは、プロジェクト名、説明、言語、接続された BLOB コンテナーの名前、タグ ファイルの場所など、プロジェクトの作成時に入力するフィールドです。
- トレーニング済みのカスタム テキスト分類モデルは、顧客が削除するまで、サービスの Azure Storage アカウントに格納されます。 モデルは、ユーザーが再トレーニングするたびに上書きされます。
- デプロイされたカスタム テキスト分類モデルは、顧客がデプロイを削除するか、モデル自体を削除するまで、サービスの Azure Storage アカウントに保持されます。 モデルは、ユーザーが同じデプロイ名にデプロイされるたびに上書きされます。
省略可能: 顧客のデータのセキュリティ
Azure サービスは、クラウド内の顧客データを保護するための適切な技術的および組織的な手段を維持しながら実装されます。
Microsoft のプライバシーとセキュリティに関するコミットメントの詳細については、Microsoft セキュリティ センターを参照してください。