次の方法で共有


ai_extract 関数

適用対象:「はい」のチェック マーク Databricks SQL 「はい」のチェック マーク Databricks Runtime

重要

この機能はパブリック プレビュー段階にあります。

プレビュー期間中は、基になる言語モデルで複数の言語を処理できますが、この AI 関数は英語用にチューニングされています。

ai_extract() 関数を使うと、最先端の生成 AI モデルを呼び出し、SQL を使って特定のテキストからラベルで指定されたエンティティを抽出できます。 この関数では、Databricks Foundation Model API で使用できるエンドポイントを提供するチャット モデルを使用します。

要件

重要

現時点で使用できる基になるモデルは、Apache 2.0 License、Copyright © The Apache Software Foundation、または LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. に基づきライセンスされます。すべての権限が予約されています。 お客様は、該当するモデル ライセンスへのコンプライアンスを遵守する責任を負います。

Databricks では、該当する使用条件に準拠するために、これらのライセンスを確認することをお勧めしています。 Databricks の内部ベンチマークに従ってパフォーマンスが向上するモデルが将来出現した場合、Databricks によってモデルが変更される可能性があります (および、このページで提供されている該当するライセンスの一覧)。

  • この関数は、リージョンがサポートされている Foundation Model API を使用した AI Functionsのワークスペースでのみ使用できます。
  • この関数は、Azure Databricks SQL クラシックでは使用できません。
  • Databricks SQL の価格ページを確認してください。
  • Databricks Runtime 15.1 以上では、この関数は Databricks ノートブック内でサポートされ、これには Databricks ワークフロー内でタスクとして実行されるノートブックも含まれます。
  • バッチ推論ワークロードでは、パフォーマンスを向上させるために Databricks Runtime 15.4 ML LTS が必要です。

メモ

Databricks Runtime 15.1 以上では、この関数は Databricks ノートブック内でサポートされ、これには Databricks ワークフロー内でタスクとして実行されるノートブックも含まれます。

構文

ai_extract(content, labels)

引数

  • content: STRING 式。
  • labels: ARRAY<STRING> リテラル。 各要素は、抽出するエンティティの種類です。

戻り値

各フィールドが STRUCTで指定されたエンティティ型に対応する labels。 各フィールドには、抽出されたエンティティを表す文字列が含まれます。 あるエンティティ型の候補が複数見つかった場合は、1 つだけ返されます。

contentNULL の場合、結果は NULL です。

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', '___location', 'organization')
  );
 {"person": "John Doe", "___location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}