Von Bedeutung
英語以外の翻訳は便宜上のみ提供されています。 バインドのバージョンについては、このドキュメントの EN-US
バージョンを参照してください。
透過性のためのメモとは
AI システムには、テクノロジだけでなく、それを使用する人、それによって影響を受ける人、それが展開される環境も含まれています。 目的に合ったシステムを作成するには、テクノロジのしくみ、その機能と制限事項、および最適なパフォーマンスを実現する方法を理解する必要があります。 Microsoft の透明性に関するメモは、AI テクノロジの機能のしくみ、システムのパフォーマンスと動作に影響を与えるシステム所有者の選択肢、およびテクノロジ、人、環境などのシステム全体について検討することの重要性を理解するためのものです。 独自のシステムを開発または展開するときに透過性のためのメモを使用することも、システムを使用するユーザーやシステムの影響を受けるユーザーと共有することもできます。
Microsoft の透明性に関するメモは、AI の原則を実践するための Microsoft の広範な取り組みの一環です。 詳細については、Microsoft AI の原則に関するページを参照してください。
カスタム テキスト分類の概要
カスタム テキスト分類 は、機械学習インテリジェンスを適用してテキスト分類タスク用のカスタム モデルを構築できるようにするクラウドベースの API サービスです。
カスタム テキスト分類では、次の 2 種類のプロジェクトがサポートされています。
- 単一ラベル分類: データセット内のファイルごとに 1 つのラベルのみを割り当てます。 たとえば、ファイルが映画スクリプトの場合、"アクション"、"スリラー"、"ロマンス" としてのみ分類できます。
- 複数のラベル分類: データセット内の各ファイルに複数のラベルを割り当てます。 たとえば、ファイルがムービー スクリプトの場合は、"Action" または "Action" と "Thriller" に分類できます。
カスタム テキスト分類の基本
カスタム テキスト分類は、Azure AI 言語内のカスタム機能の一部として提供されます。 この機能を使用すると、ユーザーはカスタム AI モデルを構築して、ユーザーが事前に定義したカスタム カテゴリにテキストを分類できます。 カスタム テキスト分類プロジェクトを作成することで、開発者はデータに反復的にタグを付け、モデルのパフォーマンスをトレーニング、評価、改善してから使用できるようになります。 タグ付けされたデータの品質は、モデルのパフォーマンスに大きく影響します。
モデルの構築とカスタマイズを簡略化するために、このサービスには 、Language Studio を介してアクセスできるカスタム Web ポータルが用意されています。 このクイックスタートの手順に従って、サービスを簡単に開始できます。
カスタム テキスト分類の用語
カスタム テキスト分類では、次の用語が一般的に使用されます。
任期 | 定義 |
---|---|
プロジェクト | プロジェクトは、データに基づいてカスタム AI モデルを構築するための作業領域です。 プロジェクトにアクセスできるのは、使用している Azure リソースへの共同作成者アクセス権を持つユーザーと他のユーザーだけです。 プロジェクト内では、データにタグを付け、モデルを構築し、必要に応じてそれらを評価して改善し、最終的にモデルをデプロイして使用できるようにすることができます。 プロジェクト内で同じデータセット上に複数のモデルを構築できます。 |
モデル | モデルは、特定のタスクを実行するようにトレーニングされたオブジェクトです。 このシステムでは、モデルによってテキストが分類されます。 モデルは、タグ付けされたデータから学習することによってトレーニングされます。 |
クラス | クラスは、テキストの全体的な分類を示すユーザー定義のカテゴリです。 開発者は、トレーニングのためにモデルに渡す前に、割り当てられたクラスでデータにタグを付けます。 |
カスタム テキスト分類のユース ケースの例
カスタム テキスト分類は、さまざまな業界の複数のシナリオで使用できます。 いくつかの例を次に示します。
自動メールまたはチケットトリアージ: すべての種類のサポート センターは、構造化されていないフリーフォームのテキストと添付ファイルを含む大量のメールまたはチケットを受け取ります。 タイムリーなレビュー、受信確認、社内チーム内における主題領域専門家へのルーティングが非常に重要です。 人間がレビューし、適切な部門にルーティングする必要があるこの規模での電子メールのトリアージには、時間とリソースが必要になります。 カスタム テキスト分類を使用すると、受信したテキストのトリアージを分析し、コンテンツを分類して、追加のアクションのために自動的に関連部門にルーティングできます。
セマンティック検索を強化および強化するためのナレッジ マイニング: 検索は、テキスト コンテンツをユーザーに表示するアプリの基礎となります。 一般的なシナリオとしては、カタログやドキュメントの検索、小売製品の検索、データ サイエンスのナレッジ マイニングなどがあります。 さまざまな業界にわたる多くの企業が、構造化および非構造化ドキュメントの両方を含む、プライベートで異種なコンテンツに対して高度な検索エクスペリエンスを構築しようと検討しています。 そのパイプラインの一部として、開発者はカスタム テキスト分類を使用して、テキストをそれぞれの業界に関連するクラスに分類できます。 これらの予測されたクラスを使用してファイルのインデックス作成を強化することで、よりカスタマイズされた検索エクスペリエンスを実現できます。
ユース ケースを選択するときの考慮事項
重大な悪影響を及ぼす可能性のある意思決定には、カスタム テキスト分類を使用しないでください。 個人に重大な影響を与える可能性のある意思決定の人間によるレビューを含めます。 たとえば、インシデントに関するユーザーの説明に基づいて、保険金請求を受け入れるか拒否するかを識別します。
あいまいで代表的ではないクラスを作成しないでください。 スキーマを設計するときは、相互に類似するクラスを避けて、相互に区別するのが難しい可能性があります。 たとえば、映画のスクリプトを分類する場合は、ロマンス、コメディ、rom-com のクラスを作成しないようにします。 代わりに、ロマンスクラスとコメディクラスで複数ラベル分類モデルを使用することを検討してください。 次に、rom-com ムービーの場合は、両方のクラスを割り当てます。
-
法的および規制上の考慮事項: 組織は、AI サービスとソリューションを使用する際に、潜在的な特定の法的および規制上の義務を評価する必要があります。これは、すべての業界またはシナリオでの使用に適していない可能性があります。 さらに、AI サービスまたはソリューションは、該当するサービス利用規約と関連する行動規範で禁止されている方法のためには設計されておらず、またそのような方法で使うこともできません。