シンクを作成する

2025-06-11

重要

Lakeflow 宣言型パイプライン create_sink API はパブリックプレビュー段階です。

create_sink()関数は、Apache Kafka や Azure Event Hubs などのイベントストリーミングサービス、または宣言型パイプラインから Delta テーブルに書き込みます。 create_sink() 関数を使用してシンクを作成した後、シンクにデータを書き込むには、追加フローでシンクを使用します。追加フローは、create_sink() 関数でサポートされている唯一のフローの種類です。 create_auto_cdc_flowなど、その他のフローの種類はサポートされていません。

Delta シンクでは、Unity カタログの外部テーブルとマネージドテーブル、および Hive メタストアマネージドテーブルがサポートされます。テーブル名は完全修飾にする必要があります。たとえば、Unity カタログテーブルでは、<catalog>.<schema>.<table>の 3 層識別子を使用する必要があります。 Hive メタストアテーブルでは、<schema>.<table>を使用する必要があります。

注

の完全更新更新を実行しても、シンクからデータが消去されることはありません。再処理されたデータはシンクに追加され、既存のデータは変更されません。
sink API では、Lakeflow 宣言パイプラインの期待はサポートされていません。

構文

import dlt

dlt.create_sink(name=<sink_name>, format=<format>, options=<options>)

パラメーター

パラメーター	タイプ	説明
`name`	`str`	必須。シンクを識別し、シンクを参照および管理するために使用される文字列。シンク名は、パイプラインの一部であるノートブックやモジュールなどのすべてのソースコードを含め、パイプラインに固有である必要があります。
`format`	`str`	必須。 `kafka` または `delta`のいずれかの出力形式を定義する文字列。
`options`	`dict`	キーと値の両方が文字列である、 `{"key": "value"}`形式のシンクオプションの一覧。 Kafka シンクと Delta シンクでサポートされているすべての Databricks ランタイムオプションがサポートされています。 Kafka オプションについては、「Kafka Structured Streaming writerの設定」を参照してください。デルタオプションについては、「シンクとしてのデルタテーブル」を参照してください。

例示

import dlt

# Create a Kafka sink
dlt.create_sink(
  "my_kafka_sink",
  "kafka",
  {
    "kafka.bootstrap.servers": "host:port",
    "topic": "my_topic"
  }
)

# Create an external Delta table sink with a file path
dlt.create_sink(
  "my_delta_sink",
    "delta",
    { "path": "/path/to/my/delta/table" }
)

# Create a Delta table sink using a table name
dlt.create_sink(
  "my_delta_sink",
    "delta",
    { "tableName": "my_catalog.my_schema.my_table" }
)

次の方法で共有

シンクを作成する

構文

パラメーター

例示

フィードバック

その他のリソース