セマンティック ランク付けとは

完了

セマンティック ランク付けは、検索結果のランク付けを向上することを目的とした Azure AI Search 内の機能です。 セマンティック ランク付けでは、言語の理解を使用して、元のクエリのコンテキストをより正確に一致させることで、検索結果のランク付けが向上します。

BM25 ランク付け関数

Azure AI Search では、既定で BM25 ランク付け関数が使用されます。 BM25 ランク付け関数は、検索語句がドキュメント内に出現する頻度に基づいて検索結果をランク付けします。 BM25 ランク付け関数は、多くの場合、検索語句を頻繁に含むドキュメントが最も関連性が高いため、優れたランク付け結果を実現しますが、必ずしもそうであるとは限りません。 BM25 ランク付けでは、クエリのセマンティクスに関連性はありません。また、言語理解を追加することでランク付けを改善できる場合があります。

セマンティック ランク付け

セマンティック ランク付けには 2 つの関数があります。言語の理解に基づいてクエリ結果のランク付けが向上し、結果にキャプションと回答を提供することでクエリへの応答が向上します。

セマンティック ランク付けでは、BM25 ランク付けを使用し、元の BM25 ランク付けを使用して新しい関連性スコアを計算し、言語理解モデルと組み合わせてクエリのコンテキストと意味を抽出します。

セマンティック キャプションと回答

セマンティック キャプションと回答は、ユーザーの結果の理解を深めるために表示できるランク付けされた検索結果と共に追加の結果を提供します。

セマンティック キャプションは、ドキュメントから要約文を逐語的に抽出し、要約文の中で最も関連性の高いテキストを強調表示します。

セマンティック回答は、質問に対する回答を提供するセマンティック ランク付けのオプションの追加機能です。 検索クエリが質問のように見え、検索結果に関連する回答と思われるテキストが含まれている場合は、セマンティック回答が返されます。

セマンティック ランク付けのしくみ

セマンティック ランキングは、BM25 ランキングの結果から上位 50 件の結果を取得します。 結果は、セマンティック構成で定義されている複数のフィールドに分割されます。 フィールドはテキスト文字列に変換され、256 個の一意のトークンにトリミングされます。 トークンは、ドキュメント内の単語とほぼ同じです。

文字列が準備されると、機械読解モデルに渡され、クエリに最も一致するフレーズと文が見つかります。 この要約句の結果はセマンティック キャプションであり、必要に応じてセマンティック回答になります。

セマンティック キャプションは、キャプションのセマンティック関連性に基づいてランク付けされるようになりました。 結果は、関連性の降順で返されます。

セマンティック ランク付け機能

AI Search の機能の概要については、次のビデオを参照してください。

セマンティック ランク付けの利点

セマンティック ランク付けには、従来の検索結果よりも 2 つの主な利点があります。

  • セマンティック ランク付けでは、結果を元のクエリのセマンティクスとより厳密に一致するようにランク付けできます。 このランク付けにより、最も役に立つドキュメントが検索結果の上部に表示される可能性が高くなります。
  • セマンティックランク付けでは、検索結果ページにキャプションとしてレンダリングし、質問に対する回答を提供する結果内の文字列を検索できます。

セマンティック ランク付けの制限事項

セマンティック ランク付けは、BM25 ランク付け関数から返される結果に適用されます。 セマンティック ランク付けでは BM25 ランク付け関数によって提供される結果を再ランク付けできますが、BM25 ランク付け関数によって返されなかった追加のドキュメントは提供されません。

セマンティック ランク付けでは、BM25 ランク付け関数の上位 50 件の結果が使用されます。 50 を超える結果が返された場合、上位 50 件の結果のみが考慮されます。

セマンティック ランク付けの価格

1 か月あたり最大 1,000 個のセマンティック ランク付けクエリを無料で利用できます。

1 か月に 1,000 を超えるクエリの場合は、標準価格を選択する必要があります。 標準価格のコストは、検索の量、検索の種類、および検索の領域に基づいています。

セマンティック ランク付け価格の詳細については、Azure AI Search の価格 に関するページを参照してください。