Azure AI Foundry API をインポートする

2025-05-20

適用対象: すべての API Management レベル

Azure AI Foundry にデプロイされた AI モデルエンドポイントを API として API Management インスタンスにインポートできます。 API Management で AI ゲートウェイポリシーやその他の機能を使用して、統合を簡素化し、監視性を向上させ、モデルエンドポイントの制御を強化します。

API Management での AI API の管理の詳細については、以下を参照してください。

Azure API Management の AI ゲートウェイ機能

クライアント互換性オプション

API Management では、AI API の 2 つのクライアント互換性オプションがサポートされています。モデルのデプロイに適したオプションを選択します。このオプションは、クライアントが API を呼び出す方法と、API Management インスタンスが AI サービスに要求をルーティングする方法を決定します。

Azure AI - Azure AIモデル推論 API を介して公開される Azure AI Foundry のモデルエンドポイントを管理します。

クライアントは、/modelsなどの/my-model/models/chat/completions エンドポイントで展開を呼び出します。デプロイ名は要求本文で渡されます。 Azure AI モデル推論 API で公開されているモデルと Azure OpenAI Service にデプロイされたモデルを柔軟に切り替える場合は、このオプションを使用します。
Azure OpenAI サービス - Azure OpenAI サービス にデプロイされたモデルエンドポイントを管理します。

クライアントは、/openaiなどの/openai/deployments/my-deployment/chat/completions エンドポイントで展開を呼び出します。デプロイ名は要求パスで渡されます。 AI サービスに Azure OpenAI サービスモデルのデプロイのみが含まれている場合は、このオプションを使用します。

[前提条件]

既存の API Management インスタンスがある。まだない場合は、作成してください。
1 つ以上のモデルがデプロイされたサブスクリプション内の Azure AI サービス。たとえば、Azure AI Foundry または Azure OpenAI Service にデプロイされたモデルが挙げられます。

ポータルを使用して AI Foundry API をインポートする

次の手順を使用して、AI API を API Management にインポートします。

API をインポートすると、API Management によって自動的に次の構成が行われます。

各 API の REST API エンドポイントの操作
AI サービスのデプロイにアクセスするために必要なアクセス許可を持つシステム割り当て ID。
API 要求を AI サービスエンドポイントに送信するバックエンドリソースとセットバックエンドサービスポリシー。
インスタンスのシステム割り当てマネージド ID を使用したバックエンドへの認証。
(必要に応じて)API の監視と管理に役立つポリシー。

AI Foundry API を API Management にインポートするには:

Azure portal で、API Management インスタンスに移動します。
左側のメニューの [API] で、[API]>[+ API の追加] を選択します。
[ Azure リソースから作成] で、[ Azure AI Foundry] を選択します。
[ AI サービスの選択 ] タブで、次の操作を行います。
1. AI サービスを検索する サブスクリプション を選択します。サービス内のモデルデプロイに関する情報を取得するには、サービス名の横にある デプロイ リンクを選択します。
2. AI サービスを選択します。
3. [次へ] を選択します。
[ API の構成 ] タブで、次の手順を実行します。
1. API の表示名と、必要に応じて説明を入力します。
2. [基本パス] に、API Management インスタンスがデプロイエンドポイントへのアクセスに使用するパスを入力します。
3. 必要に応じて、API に関連付ける 1 つ以上の製品を選択します。
4. [クライアントの互換性] で、サポートするクライアントの種類に基づいて、次のいずれかを選択します。詳細については、「クライアント互換性オプション」を参照してください。
  - Azure OpenAI - クライアントが Azure OpenAI サービスモデルのデプロイにのみアクセスする必要がある場合は、このオプションを選択します。
  - Azure AI - クライアントが Azure AI Foundry の他のモデルにアクセスする必要がある場合は、このオプションを選択します。
5. [次へ] を選択します。
[ トークン消費の管理 ] タブで、必要に応じて設定を入力するか、API の監視と管理に役立つ次のポリシーを定義する既定値を受け入れます。
- トークンの使用を管理する
- トークンの使用状況を追跡する
[ セマンティックキャッシュの適用 ] タブで、必要に応じて設定を入力するか、API のパフォーマンスの最適化と待機時間の短縮に役立つポリシーを定義する既定値を受け入れます。
- 応答のセマンティックキャッシュを有効にする
AI コンテンツの安全性で、必要に応じて設定を入力するか、既定値を受け入れて、安全でないコンテンツを含むプロンプトをブロックするように Azure AI Content Safety サービスを構成します。
- LLM 要求にコンテンツの安全性チェックを適用する
[レビュー] を選択します。
設定が検証されたら、[作成] を選択します。

AI API をテストする

AI API が期待どおりに動作していることを確認するには、API Management テストコンソールでテストします。

前の手順で作成した API を選びます。
[テスト] タブを選びます。
モデルのデプロイと互換性のある操作を選択します。ページにパラメーターとヘッダーのフィールドが表示されます。
必要に応じてパラメーターとヘッダーを入力します。操作によっては、 要求本文の構成または更新が必要になる場合があります。

注

テストコンソールでは、API Management によって Ocp-Apim-Subscription-Key ヘッダーが自動的に設定され、組み込みのオールアクセスサブスクリプションのサブスクリプションキーが構成されます。このキーを使用すると、API Management インスタンス内のすべての API にアクセスできます。必要に応じて、 HTTP 要求の横にある "目" のアイコンを選択して、 Ocp-Apim-Subscription-Key ヘッダーを表示します。
[Send] を選択します。

テストが成功すると、バックエンドは成功した HTTP 応答コードと一部のデータで応答します。応答に追加されるのは、言語モデルのトークン消費を監視および管理するのに役立つトークン使用状況データです。

次の方法で共有

Azure AI Foundry API をインポートする

クライアント互換性オプション

[前提条件]

ポータルを使用して AI Foundry API をインポートする

AI API をテストする

関連コンテンツ

フィードバック

その他のリソース