ベクトルインデックスを作成する

2025-07-07

Azure AI Search では、インデックスの作成または更新 (REST API) を使用して、ベクターを検索インデックスに格納できます。ベクターインデックスは、ベクターフィールド、非ベクトルフィールド、およびベクター構成セクションを持つインデックススキーマによって定義されます。

ベクターインデックスを作成するときは、ベクタークエリのコーパスとして機能する 埋め込み空間 を暗黙的に作成します。埋め込み空間は、同じ埋め込みモデルからの埋め込みによって設定されたすべてのベクターフィールドで構成されます。クエリ時に、システムはベクタークエリをインデックス付きベクターと比較し、セマンティック類似性に基づいて結果を返します。

Azure AI Search でベクターのインデックスを作成するには、次の手順に従います。

基本的なスキーマ定義から始めます。
ベクターアルゴリズムとオプションの圧縮を追加します。
ベクターフィールド定義を追加します。
事前ベクトル化されたデータを別の手順として読み込むか、インデックス作成中のデータチャンクと埋め込みに統合ベクター化を使用します。

この記事では、REST を使って説明します。基本的なワークフローを理解したら、 azure-search-vector-samples リポジトリの Azure SDK コードサンプルに進みます。このリポジトリでは、テストコードと運用コードでのベクターの使用に関するガイダンスが提供されます。

ヒント

Azure portal を使用してベクターインデックスを作成し、統合されたデータチャンクとベクター化を試すこともできます。

前提条件

任意のリージョンおよび任意のレベルの Azure AI Search サービス。 Azure AI スキルとベクターライザーで統合ベクター化を使用する予定の場合、Azure AI Search は、Azure AI Vision でホストされている埋め込みモデルと同じリージョンにある必要があります。
ソースドキュメントには、インデックスにアップロードするベクター埋め込みがある必要があります。この手順では、統合ベクター化を使用することもできます。
ベクターフィールドにその制限を割り当てることができるように、埋め込みを作成するモデルの寸法制限を把握しておく必要があります。 text-embedding-ada-002 の場合、次元は 1536 で固定されます。 text-embedding-3-small または text-embedding-3-large の場合、寸法はそれぞれ 1 から 1536、1 から 3072 の範囲です。
使用する類似性メトリックを把握しておく必要があります。 Azure OpenAI にモデルを埋め込む場合は、 cosineを使用して類似性が計算されます。
インデックスを作成する方法を知っている必要があります。スキーマには、常にドキュメントキーのフィールド、検索またはフィルターのフィールド、およびインデックス作成とクエリ中に必要な動作のその他の構成が含まれます。

制限事項

2019 年 1 月より前に作成された一部の検索サービスでは、ベクターインデックスを作成できません。これに該当する場合は、ベクトルを使用する新しいサービスを作成します。

インデックス作成のためのドキュメントを準備する

インデックスを作成する前に、ベクターデータと非ベクトルデータのフィールドを含むドキュメントペイロードをアセンブルします。ドキュメント構造は、インデックススキーマのフィールドコレクションに準拠している必要があります。

ソースドキュメントで次の内容が提供されていることを確認します。

コンテンツ	説明
一意識別子	各ドキュメントを一意に識別するフィールドまたはメタデータプロパティ。すべての検索インデックスにはドキュメントキーが必要です。ドキュメントキーの要件を満たすには、ソースドキュメントにインデックス内で一意に識別されるフィールドまたはプロパティが 1 つ必要です。 BLOBをインデックス化する場合、各blobを一意に識別するのがmetadata_storage_pathかもしれません。データベースからインデックスを作成する場合は、主キーである可能性があります。このソースフィールドは、`Edm.String` 型のインデックスフィールドにマップし、検索インデックスで `key=true` である必要があります。
非ベクターコンテンツ	人間が判読できるコンテンツを他のフィールドに提供します。人間が判読できるコンテンツは、クエリ応答と、同じ要求にフルテキスト検索またはセマンティックランク付けを含むハイブリッドクエリに役立ちます。チャット完了モデルを使用している場合、ChatGPT のようなほとんどのモデルでは人間が判読できるテキストが必要であり、未加工のベクターは入力として受け入れられません。
ベクターコンテンツ	クエリ時に使用する非ベクトルコンテンツのベクター化表現。ベクトルは、埋め込みモデルによって生成される単精度浮動小数点数の配列です。各ベクターフィールドには、モデルによって生成された配列が含まれています。フィールドごとに 1 つの埋め込みがあり、フィールドは最上位のフィールド (入れ子になった型または複合型の一部ではありません) です。単純な統合を行う場合は、 Azure OpenAI にモデルを埋め込む (テキストドキュメントの場合は text-embedding-3 、イメージとマルチモーダル埋め込みの場合は Image Retrieval REST API など) をお勧めします。インデクサーとスキルセットを使用できる場合は、インデックス作成中に画像とテキストをエンコードする統合ベクター化を検討してください。フィールド定義はベクトルフィールド用のものですが、入力されるソースデータはテキストと画像のどちらでも構いません。これらはインデックス作成中にベクトル配列に変換されます。

検索インデックスには、サポートするすべてのクエリシナリオのフィールドと内容が含まれている必要があります。製品名、バージョン、メタデータ、または住所を検索またはフィルター処理するとします。この場合、ベクター類似性検索は特に役に立ちません。キーワード検索、geo 検索、または逐語的なコンテンツを反復処理するフィルターが適しています。ベクターフィールドと非ベクトルフィールドの両方を含む検索インデックスは、クエリの構築と応答の構成に最大限の柔軟性を提供します。

ベクターフィールドと非ベクトルフィールドを含むドキュメントペイロードの短い例については、この記事の「ロードベクターデータ」セクションを参照してください。

基本的なインデックスから始める

最小限のスキーマから開始することで、ベクター構成やベクターフィールドを追加する前に作業可能な定義を持てるようにします。単純なインデックスは次の例のようになります。インデックススキーマの詳細については、「検索インデックスの作成」を参照してください。

インデックスには、必須の名前、必須のドキュメントキー ("key": true)、およびプレーンテキストで人間が判読できるコンテンツのフィールドがあることに注意してください。ベクター化する予定のコンテンツの人間が判読できるバージョンを用意するのが一般的です。たとえば、PDF ファイルのテキストのチャンクがある場合、インデックススキーマにはプレーンテキストチャンク用のフィールドと、ベクター化されたチャンク用の 2 番目のフィールドが必要です。

"name"、"fields" コレクション、および追加構成のためのその他のコンストラクトを含む基本的なインデックスを次に示します。

POST https://[servicename].search.windows.net/indexes?api-version=[api-version] 
{
  "name": "example-index",
  "fields": [
    { "name": "documentId", "type": "Edm.String", "key": true, "retrievable": true, "searchable": true, "filterable": true },
    { "name": "myHumanReadableNameField", "type": "Edm.String", "retrievable": true, "searchable": true, "filterable": false, "sortable": true, "facetable": false },
    { "name": "myHumanReadableContentField", "type": "Edm.String", "retrievable": true, "searchable": true, "filterable": false, "sortable": false, "facetable": false, "analyzer": "en.microsoft" },
  ],
  "analyzers": [ ],
  "scoringProfiles": [ ],
  "suggesters": [ ],
  "vectorSearch": [ ]
}

ベクトル検索構成を追加する

次に、スキーマに "vectorSearch" 構成を追加します。ここで定義するプロファイルはベクターフィールドの定義の一部になるため、フィールド定義の前に構成を指定すると便利です。スキーマでは、ベクター構成は通常、フィールドコレクションの後 ( "analyzers"、 "scoringProfiles"、 "suggesters"の後など) に挿入されます。ただし、順序は関係ありません。

ベクター構成には、次のものが含まれます。

vectorSearch.algorithms は、インデックス作成中にベクターノード間に "最も近い近隣" 情報を作成するために使用されます。
vectorSearch.compressions スカラー量子化またはバイナリ量子化、オーバーサンプリング、および元のベクトルを使用した再ランク付けの場合。
vectorSearch.profiles アルゴリズムと圧縮構成の複数の組み合わせを指定する場合。

2024-07-01
2024-05-01-preview

2024-07-01 は一般提供されています。次のベクター構成がサポートされています。

階層ナビゲーション可能スモールワールド (HNSW) アルゴリズム。
完全な K ニアレストネイバー (KNN) アルゴリズム。
スカラー圧縮
バイナリ圧縮。2024-07-01 でのみ、新しい Azure SDK パッケージで使用できます。
オーバーサンプリング。
元のベクターを使用した再ランク付け。

フィールドで HNSW を選択した場合は、クエリ時に完全な KNN を選択できます。ただし、その逆は機能しません。インデックス作成のために包括的なデータを選択した場合、後で HNSW 検索を要求することはできません。これは、近似検索を有効にする追加のデータ構造が存在しないためです。

コンテンツをベクトル化するための戦略を必ず用意してください。組み込みのエンコードには、垂直統合とクエリ時ベクトル化をお勧めします。

インデックスの作成または更新 REST API を使用してインデックスを作成します。
埋め込み空間の作成に使用する検索アルゴリズムを指定する vectorSearch セクションをインデックスに追加します。
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         },
         {
             "name": "binary-quantization",
             "kind": "binaryQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-scalar",
         "compression": "scalar-quantization",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
重要なポイント:
- 圧縮、アルゴリズム、プロファイルの各構成の名前は、その種類ごとに、インデックス内で一意である必要があります。
- vectorSearch.compressions には、scalarQuantization または binaryQuantization を指定できます。スカラー量子化では、浮動小数点値をより少ないビット数のデータ型に圧縮します。二項量子化は、浮動小数点をバイナリ 1 ビット値に変換します。
- vectorSearch.compressions.rerankWithOriginalVectors は元の非圧縮ベクトルを使用して類似性を再計算し、最初の検索クエリによって返される上位の結果を再ランク付けします。 stored が false の場合でも、非圧縮ベクトルが検索インデックスに存在します。このプロパティは省略可能です。既定値は True です。
- 量子化による情報の減少を緩和するために、vectorSearch.compressions.defaultOversampling は潜在的な結果のより広範なセットを考慮します。潜在的な結果の数式は、クエリ内の k とオーバーサンプリング乗数で構成されます。たとえば、クエリで k 5 を指定し、オーバーサンプリングが 20 の場合、クエリは実質的に、その目的のために元の非圧縮ベクターを使用して、再ランク付けに使用する 100 個のドキュメントを要求します。上位 k の再ランキングされた結果のみが返されます。このプロパティは省略可能です。既定値は 4 です。
- vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType が int8 に設定されていること。これは現時点でサポートされている唯一のプリミティブデータ型です。このプロパティは省略可能です。既定値は int8 です。
- vectorSearch.algorithms は hnsw または exhaustiveKnn です。これらは、インデックス作成中にベクトルコンテンツを整理するために使用される近似最近傍 (ANN) アルゴリズムです。
- vectorSearch.algorithms.m は、双方向リンク数です。既定値は 4 です。範囲は 4 ～ 10 です。値を小さくすると、結果のノイズが少なくなります。
- vectorSearch.algorithms.efConstruction は、インデックス作成中に使用される最も近い近隣ノードの数です。既定値は 400 です。範囲は 100 ～ 1,000 です。
- "vectorSearch.algorithms.efSearch は、検索中に使用される最も近い近隣ノードの数です。既定値は 500 です。範囲は 100 ～ 1,000 です。
- vectorSearch.algorithms.metric Azure OpenAI を使用している場合は cosine する必要があります。それ以外の場合は、使用している埋め込みモデルに関連付けられている類似性メトリックを使用します。サポートされている値は、 cosine、 dotProduct、 euclidean、および hamming です ( バイナリデータのインデックス作成に使用されます)。
- vectorSearch.profiles によって、より豊富な定義に対応するための抽象化レイヤーが追加されます。プロファイルは vectorSearch で定義され、各ベクターフィールドの名前によって参照されます。これは圧縮とアルゴリズム構成の組み合わせです。このプロパティをベクターフィールドに割り当てて、フィールドのアルゴリズムと圧縮を決定します。

2024-05-01-preview が最新のプレビューバージョンです。以前のプレビューバージョンも含まれています。

プレビュー版と安定版の API では、同じ vectorSearch 構成がサポートされます。より多くの圧縮オプションやクエリ時に呼び出される新しいベクターライザーなど、その他の理由から、安定したバージョンよりもプレビューを選択します。

インデックスの作成または更新のプレビュー REST API を使用してインデックスを作成します。
圧縮設定と、埋め込みスペースの作成に使用される検索アルゴリズムを指定する vectorSearch セクションをインデックスに追加します。詳しくは、ベクトル量子化の構成に関する記事をご覧ください。
```
 "vectorSearch": {
     "compressions": [
         {
             "name": "my-scalar-quantization",
             "kind": "scalarQuantization",
             "rerankWithOriginalVectors": true,
             "defaultOversampling": 10.0,
                 "scalarQuantizationParameters": {
                     "quantizedDataType": "int8"
                 }
         }
     ],
     "algorithms": [
         {
             "name": "hnsw-1",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 4,
                 "efConstruction": 400,
                 "efSearch": 500,
                 "metric": "cosine"
             }
         },
         {
             "name": "hnsw-2",
             "kind": "hnsw",
             "hnswParameters": {
                 "m": 8,
                 "efConstruction": 800,
                 "efSearch": 800,
                 "metric": "hamming"
             }
         },
         {
             "name": "eknn",
             "kind": "exhaustiveKnn",
             "exhaustiveKnnParameters": {
                 "metric": "euclidean"
             }
         }

     ],
     "profiles": [
       {
         "name": "vector-profile-hnsw-1",
         "algorithm": "hnsw-1"
       }
     ]
 }
```
重要なポイント:
- vectorSearch.compressions.kind は、scalarQuantization である必要があります。
- vectorSearch.compressions.rerankWithOriginalVectors は元の非圧縮ベクトルを使用して類似性を再計算し、最初の検索クエリによって返される上位の結果を再ランク付けします。 stored が false の場合でも、非圧縮ベクトルが検索インデックスに存在します。このプロパティは省略可能です。既定値は True です。
- 量子化による情報の減少を緩和するために、vectorSearch.compressions.defaultOversampling は潜在的な結果のより広範なセットを考慮します。潜在的な結果の数式は、クエリ内の k とオーバーサンプリング乗数で構成されます。たとえば、クエリで k 5 を指定し、オーバーサンプリングが 20 の場合、クエリは実質的に、その目的のために元の非圧縮ベクターを使用して、再ランク付けに使用する 100 個のドキュメントを要求します。上位 k の再ランキングされた結果のみが返されます。このプロパティは省略可能です。既定値は 4 です。
- vectorSearch.compressions.scalarQuantizationParameters.quantizedDataType が int8 に設定されていること。これは現時点でサポートされている唯一のプリミティブデータ型です。このプロパティは省略可能です。既定値は int8 です。
- vectorSearch.algorithms.kind は hnsw または exhaustiveKnn です。これらは、インデックス作成中にベクトルコンテンツを整理するために使用される近似最近傍 (ANN) アルゴリズムです。
- vectorSearch.algorithms.m は、双方向リンク数です。既定値は 4 です。範囲は 4 ～ 10 です。値を小さくすると、結果のノイズが少なくなります。
- vectorSearch.algorithms.efConstruction は、インデックス作成中に使用される最も近い近隣ノードの数です。既定値は 400 です。範囲は 100 ～ 1,000 です。
- vectorSearch.algorithms.efSearch は、検索中に使用される最も近い近隣ノードの数です。既定値は 500 です。範囲は 100 ～ 1,000 です。
- vectorSearch.algorithms.metric Azure OpenAI を使用している場合は cosine する必要があります。それ以外の場合は、使用している埋め込みモデルに関連付けられている類似性メトリックを使用します。サポートされている値は、 cosine、 dotProduct、 euclidean、および hamming です ( バイナリデータのインデックス作成に使用されます)。
- vectorSearch.profiles によって、より豊富な定義に対応するための抽象化レイヤーが追加されます。プロファイルは vectorSearch で定義され、各ベクターフィールドの名前によって参照されます。これは圧縮とアルゴリズム構成の組み合わせです。このプロパティをベクターフィールドに割り当てて、フィールドのアルゴリズムと圧縮を決定します。

新しいプレビュー機能の詳細については、「Azure AI Search の新機能」を参照してください。

フィールドコレクションにベクトルフィールドを追加する

ベクター構成を作成したら、フィールドコレクションにベクターフィールドを追加できます。フィールドコレクションには、ドキュメントキー、ベクターフィールド、および RAG ワークロードでのハイブリッド検索シナリオまたはチャットモデルの完了に必要なその他の非ベクトルフィールドのフィールドが含まれている必要があることを思い出してください。

ベクターフィールドは、データ型、ベクターの出力に使用される埋め込みモデルに基づく dimensions プロパティ、および前の手順で作成したベクタープロファイルによって特徴付けられます。

2024-07-01
2024-05-01-preview

2024-07-01 は一般提供されています。

インデックスの作成または更新 REST API を使用してインデックスを作成し、フィールドコレクションにベクターフィールドを追加します。

{
  "name": "example-index",
  "fields": [
    {
        "name": "contentVector",
        "type": "Collection(Edm.Single)",
        "searchable": true,
        "retrievable": false,
        "stored": false,
        "dimensions": 1536,
        "vectorSearchProfile": "vector-profile-1"
    }
  ]
}

次の属性を持つベクターフィールドを指定します。生成された埋め込みをフィールドごとに 1 つ格納できます。各ベクトルフィールドについて次を行います。
- type はベクターデータ型である必要があります。 Collection(Edm.Single) は、モデルの埋め込みに最も一般的です。
- dimensions は、埋め込みモデルによって生成されるディメンションの数です。 text-embedding-ada-002 の場合は 1,536 に固定されます。 text-embedding-3 モデルシリーズの場合は、値の範囲があります。垂直統合と埋め込みスキルを使用してベクトルを生成する場合は、このプロパティが埋め込みスキルで使用される値と同じディメンション値に設定されていることを確認してください。
- vectorSearchProfile は、インデックス内の他の場所で定義されているプロファイルの名前です。
- searchable は true にする必要があります。
- retrievable には、true または false を指定できます。 True を指定すると、生のベクトル (そのうち 1,536 個) がプレーンテキストとして返され、ストレージ領域が消費されます。ベクトル結果をダウンストリームアプリに渡す場合は、true に設定します。
- stored には、true または false を指定できます。これは、取得に備えてベクトルの追加コピーを保存するかどうかを決定します。詳細については、ベクトルサイズを小さくする方法に関する記事を参照してください。
- filterable、 facetable、および sortable は false にする必要があります。
titleでfilterable処理を呼び出す場合は、を true に設定したなど、フィルター可能な非ベクトルフィールドをコレクションに追加します。

インデックスを作成するテキストコンテンツの内容と構造を定義する他のフィールドを追加します。最低でも、ドキュメントキーが必要です。

また、クエリまたはその応答に役立つフィールドも追加する必要があります。次の例は、ベクトルと同等のタイトルとコンテンツ (titleVector と contentVector) のベクターフィールドを示しています。また、検索結果の並べ替え、フィルター処理、読み取りに役立つ同等のテキストコンテンツ (title と content) のフィールドも提供します。

次の例は、フィールドコレクションを示しています。

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-07-01&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "title",
            "type": "Edm.String",
            "searchable": true,
            "filterable": true,
            "sortable": true,
            "retrievable": true
        },
        {
            "name": "titleVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": true,
            "stored": true,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "content",
            "type": "Edm.String",
            "searchable": true,
            "retrievable": true
        },
        {
            "name": "contentVector",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

2024-05-01-preview が最新のプレビューバージョンです。すべてのベクターデータ型のサポートを含め、安定バージョンと同じベクターフィールド定義をサポートします。

インデックスの作成または更新のプレビュー REST API を使用してインデックスを作成し、フィールドコレクションにベクターフィールドを追加します。

{
  "name": "example-index",
  "fields": [
    {
        "name": "contentVector",
        "type": "Collection(Edm.Single)",
        "searchable": true,
        "retrievable": false,
        "stored": false,
        "dimensions": 1536,
        "vectorSearchProfile": "vector-profile-1"
    }
  ]
}

次の属性を持つベクターフィールドを指定します。生成された埋め込みをドキュメントフィールドごとに 1 つ格納できます。各ベクトルフィールドについて次を行います。
- type には、 Collection(Edm.Single)、 Collection(Edm.Half)、 Collection(Edm.Int16)、または Collection(Edm.SByte)を指定できます。
- dimensions は、埋め込みモデルによって生成されるディメンションの数です。 text-embedding-ada-002 の場合は、1,536 個です。
- vectorSearchProfile は、インデックス内の他の場所で定義されているプロファイルの名前です。
- searchable は true にする必要があります。
- retrievable には、true または false を指定できます。 True を指定すると、生のベクトル (そのうち 1,536 個) がプレーンテキストとして返され、ストレージ領域が消費されます。ベクトル結果をダウンストリームアプリに渡す場合は、true に設定します。 stored が false の場合は False が必要です。
- stored は、ベクトルフィールドにのみ適用される新しいブール型プロパティです。 True にすると、検索結果で返されたベクトルのコピーが保存されます。 False にすると、インデックス作成中にそのコピーが破棄されます。ベクトルを検索することはできますが、結果にベクターを返すことはできません。
- filterable、 facetable、および sortable は false にする必要があります。
filterableで事前フィルター処理または事後フィルター処理を呼び出す場合は、を true に設定した "title" など、フィルターを適用できる非ベクトルフィールドをコレクションに追加します。

インデックスを作成するテキストコンテンツの内容と構造を定義する他のフィールドを追加します。最低でも、ドキュメントキーが必要です。

次の例は、フィールドコレクションを示しています。

PUT https://my-search-service.search.windows.net/indexes/my-index?api-version=2024-05-01-preview&allowIndexDowntime=true
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "name": "{{index-name}}",
    "fields": [
        {
            "name": "id",
            "type": "Edm.String",
            "key": true,
            "filterable": true
        },
        {
            "name": "firstVectorfield-float32-embeddings",
            "type": "Collection(Edm.Single)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "secondVectorfield-float16-embeddings",
            "type": "Collection(Edm.Half)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "thirdVectorfield-int8-embeddings-for-my-custom-quantization-output",
            "type": "Collection(Edm.SByte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        },
        {
            "name": "fourthVectorfield-for-binary-data",
            "type": "Collection(Edm.Byte)",
            "searchable": true,
            "retrievable": false,
            "stored": false,
            "dimensions": 1536,
            "vectorSearchProfile": "vector-profile-1"
        }
    ],
    "vectorSearch": {
        "algorithms": [
            {
                "name": "hnsw-1",
                "kind": "hnsw",
                "hnswParameters": {
                    "m": 4,
                    "efConstruction": 400,
                    "efSearch": 500,
                    "metric": "cosine"
                }
            }
        ],
        "profiles": [
            {
                "name": "vector-profile-1",
                "algorithm": "hnsw-1"
            }
        ]
    }
}

インデックス作成のためベクトルデータを読み込む

インデックス作成用に指定するコンテンツは、インデックススキーマに準拠し、ドキュメントキーの一意の文字列値を含んでいる必要があります。事前ベクトル化データは、非ベクトルコンテンツを含む他のフィールドと共存できる 1 つ以上のベクトルフィールドに読み込まれます。

データインジェストでは、プッシュまたはプルの手法を使用できます。

プッシュAPI
Pull API (インデクサー)

Documents - Index を使用して、ベクトルデータと非ベクトルデータをインデックスに読み込みます。インデックス作成用のプッシュ API は、すべての安定バージョンとプレビューバージョンで同じです。ドキュメントを読み込むには、次のいずれかの API を使用します。

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/index?api-version=2024-07-01

{
    "value": [
        {
            "id": "1",
            "title": "Azure App Service",
            "content": "Azure App Service is a fully managed platform for building, deploying, and scaling web apps. You can host web apps, mobile app backends, and RESTful APIs. It supports a variety of programming languages and frameworks, such as .NET, Java, Node.js, Python, and PHP. The service offers built-in auto-scaling and load balancing capabilities. It also provides integration with other Azure services, such as Azure DevOps, GitHub, and Bitbucket.",
            "category": "Web",
            "titleVector": [
                -0.02250031754374504,
                 . . . 
                        ],
            "contentVector": [
                -0.024740582332015038,
                 . . .
            ],
            "@search.action": "upload"
        },
        {
            "id": "2",
            "title": "Azure Functions",
            "content": "Azure Functions is a serverless compute service that enables you to run code on-demand without having to manage infrastructure. It allows you to build and deploy event-driven applications that automatically scale with your workload. Functions support various languages, including C#, F#, Node.js, Python, and Java. It offers a variety of triggers and bindings to integrate with other Azure services and external services. You only pay for the compute time you consume.",
            "category": "Compute",
            "titleVector": [
                -0.020159931853413582,
                . . .
            ],
            "contentVector": [
                -0.02780858241021633,
                 . . .
            ],
            "@search.action": "upload"
        }
        . . .
    ]
}

プル API は、データの取得と更新から、ベクター検索のコンテンツをエンコードする統合ベクター化まで、複数のインデックス作成手順を自動化するインデクサーを指します。

データソースは、サポートされている種類である必要があります。
スキルセットは、データチャンクのためのテキスト分割スキルと、埋め込みモデルに接続するスキルを提供します。一般提供されているスキルもあれば、プレビュー段階にあるスキルもあります。スキルとベクトライザーは、埋め込みを生成するために使用されます。インデックス作成に選択するスキルは、クエリのための同等のベクトル化とペアにする必要があります。インデックス作成中のベクトル化に対しては、次のスキルから選択します。
- AzureOpenAIEmbedding スキル
- Custom Web API スキル
- Azure AI Vision マルチモーダル埋め込みスキル (プレビュー)
- Azure AI Foundry モデルカタログでホストされているモデルに対して埋め込みを生成する AML スキル (プレビュー)。詳細については、「統合ベクター化のための Azure AI Foundry モデルカタログからの埋め込みモデルの使用」を参照してください。
インデックスは、ベクトルフィールドの定義とベクトル検索の構成を提供します。この記事では、これらの定義について説明します。
インデクサーはインデックス作成パイプラインを駆動します。詳細については、インデクサーの作成に関する記事を参照してください。

インデクサーとスキルセットに慣れている場合:

フィールドマッピング、出力フィールドマッピング、および削除検出の設定は、ベクトルフィールドと非ベクトルフィールドに等しく適用されます。
ベクターデータがファイル内でソース化されている場合は、データの形状に基づいて、既定以外の parsingMode ( json、 jsonLines、 csv など) をお勧めします。
データソースについては、前述の parsingModes のいずれかを備えた Azure BLOB インデクサーと Azure Cosmos DB for NoSQL インデクサーがテストされ、動作することが確認されています。
データソースのすべてのベクトルの次元は同じで、マッピング先のフィールドのインデックス定義と一致している必要があります。一致しないドキュメントの場合、インデクサーはエラーを発生させます。

インデックスにベクターコンテンツのクエリを実行する

検証目的で、Azure portal の検索エクスプローラーまたは REST API 呼び出しを使用してインデックスのクエリを実行できます。 Azure AI Search ではベクトルを人間が判読できるテキストに変換できないため、一致のエビデンスを提供する同じドキュメントからフィールドを返すようにしてください。たとえば、ベクタークエリが titleVector フィールドを対象とする場合は、検索結果の title を選択できます。

フィールドは、結果に含める retrievable として属性付けする必要があります。

Azure Portal
REST API

[検索管理]>[インデックス] でインデックスを確認して、インデックスサイズの合計とベクトルのインデックスサイズを表示します。正のベクトルインデックスサイズは、ベクトルが存在することを示します。
検索エクスプローラーを使用して、インデックスのクエリを実行します。検索エクスプローラーには、クエリビュー (既定) と JSON ビューの 2 つのビューがあります。
- [クエリオプション]>[Hide vector values in search results] (検索結果でベクトル値を非表示する) を設定して、結果を読みやすくします。
- ベクトルクエリに JSON ビューを使用します。実行するベクタークエリの JSON 定義を貼り付けることができます。インデックスにベクター化代入がある場合は、組み込みのテキストからベクターへの変換、または画像からベクターへの変換を使用することもできます。画像検索の詳細については、クイックスタート: 検索エクスプローラーで画像を検索する方法に関する記事を参照してください。
- 既定のクエリビューを使用して、インデックスにベクトルが含まれていることをすばやく確認します。クエリビューはフルテキスト検索用です。ベクトルクエリには使用できませんが、空の検索 (search=*) を送信してコンテンツを確認できます。ベクトルフィールドを含むすべてのフィールドの内容が、プレーンテキストとして返されます。

詳細については、「ベクタークエリの作成」を参照してください。

次の REST API の例はベクタークエリですが、非ベクトルフィールド (title、 content、 category) のみを返します。検索結果には、 retrievable としてマークされたフィールドのみを返すことができます。

POST https://my-search-service.search.windows.net/indexes/my-index/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "vector": {
        "value": [
            -0.009154141,
            0.018708462,
            . . . 
            -0.02178128,
            -0.00086512347
        ],
        "fields": "contentVector",
        "k": 5
    },
    "select": "title, content, category"
}

ベクターインデックスを更新する

ベクターインデックスを更新するには、スキーマを変更し、ドキュメントを再読み込みして新しいフィールドを設定します。スキーマ更新の API には、インデックスの作成または更新 (REST)、Azure SDK for .NET の CreateOrUpdateIndex、Azure SDK for Python の create_or_update_index、その他の Azure SDK の同様のメソッドが含まれます。

インデックスの更新に関する標準的なガイダンスについては、「インデックスの更新または再構築」を参照してください。

重要なポイントは次のとおりです。

多くの場合、既存のフィールドの更新と削除には、インデックスの削除と完全な再構築が必要です。
再構築を必要とせず、次の変更を行うことができます。
- Fields コレクションに新しいフィールドを追加します。
- 新しいベクター構成を追加します。新しいフィールドには割り当てられますが、既にベクター化されている既存のフィールドには割り当てません。
- 既存のフィールドの retrievable 変更 (値は true または false)。ベクトルフィールドは検索可能で取得可能である必要がありますが、削除と再構築が不可能な状況でベクトルフィールドへのアクセスを無効にする場合は、retrievable を false に設定できます。

次のステップ

次の手順として、ベクタークエリを作成することをお勧めします。

azure-search-vector-samples リポジトリのコードサンプルでは、スキーマ定義、ベクトル化、インデックス作成、クエリを含むエンドツーエンドのワークフローが示されています。

Python、C#、JavaScript 用のデモコードがあります。

次の方法で共有

ベクトル インデックスを作成する

前提条件

制限事項

インデックス作成のためのドキュメントを準備する

基本的なインデックスから始める

ベクトル検索構成を追加する

フィールド コレクションにベクトル フィールドを追加する

インデックス作成のためベクトル データを読み込む

インデックスにベクター コンテンツのクエリを実行する

ベクター インデックスを更新する