コピーアクティビティで Azure SQL Database を構成する

2025-02-11

この記事では、データパイプラインでコピーアクティビティを使用して、Azure SQL Database との間でデータをコピーする方法について説明します。

サポートされている構成

コピーアクティビティの下の各タブの構成については、それぞれ次のセクションを参照してください。

全般
ソース
宛先
マッピング
設定

全般

全般設定ガイダンスを参照して、全般設定タブを構成します。

ソース

コピーアクティビティの [ソース] タブの Azure SQL Database では、次のプロパティがサポートされます。

必要なプロパティは次のとおりです :

[データストアの種類]: [外部] を選択します。
接続: 接続の一覧から Azure SQL Database 接続を選択します。接続が存在しない場合は、[新規] を選択して新しい Azure SQL Database 接続を作成します。
接続の種類: Azure SQL Databaseを選択します。
テーブル: ドロップダウンリストからデータベース内のテーブルを選択します。または、[ 編集] をオンにして、テーブル名を手動で入力します。
データのプレビュー: プレビューデータ を選択して、テーブル内のデータをプレビューします。

[詳細設定で、次のフィールドを指定できます。

クエリを使用する: テーブル、クエリ、またはストアドプロシージャを選択できます。次の一覧では、各設定の構成について説明します。
- テーブル: このボタンを選択した場合、テーブルで指定したテーブルからデータを読み取る。
- クエリ: データを読み取るカスタム SQL クエリを指定します。たとえば、select * from MyTableです。または、コードエディターで編集する鉛筆アイコンを選択します。
- ストアドプロシージャ: ソーステーブルからデータを読み取るストアドプロシージャを使用します。最後の SQL ステートメントは、ストアドプロシージャ内の SELECT ステートメントである必要があります。
  - ストアドプロシージャ名: ソーステーブルからデータを読み取る [ の編集] ボックスをオンにするときに、ストアドプロシージャを選択するか、ストアドプロシージャ名を手動で指定します。
  - ストアドプロシージャパラメーター: ストアドプロシージャパラメーターの値を指定します。使用できる値は、名前または値のペアです。パラメーターの名前と大文字と小文字の区別は、ストアドプロシージャパラメーターの名前と大文字と小文字の区別と一致する必要があります。
クエリタイムアウト (分): クエリコマンドの実行のタイムアウトを指定します。既定値は 120 分です。このプロパティにパラメーターが設定されている場合、使用できる値は"02:00:00" (120 分) などの期間です。
分離レベル: SQL ソースのトランザクションロック動作を指定します。使用できる値は、None、ReadCommitted、ReadUncommitted、RepeatableRead、Serializable、またはスナップショットです。指定しない場合は、分離レベル None が使用されます。詳細については、「IsolationLevel 列挙型」を参照してください。
パーティションオプション: Azure SQL Database からデータを読み込むのに使用するデータパーティション分割オプションを指定します。使用できる値は、None (既定値)、テーブル の物理パーティション、ダイナミックレンジです。パーティションオプションが有効になっている場合 (つまり、なしではない場合)、Azure SQL Database から同時にデータを読み込む並列処理の程度は、コピーアクティビティの並列コピー設定によって制御されます。
- なし: パーティションを使用しない場合は、この設定を選択します。
- テーブルの物理パーティション: 物理パーティションを使用すると、物理テーブル定義に基づいてパーティション列とメカニズムが自動的に決定されます。
- ダイナミックレンジ: 並列が有効なクエリを使用する場合は、範囲パーティションパラメーター (?DfDynamicRangePartitionCondition) が必要です。サンプルクエリ: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition。
  - パーティション列名: 並列コピーの範囲パーティション分割で使用されるソース列の名前 整数型または date/date time 型 (int、smallint、bigint、date、smalldatetime、datetime、datetime2、または datetimeoffset) で指定します。指定しない場合、テーブルのインデックスまたは主キーが自動検出され、パーティション列として使用されます。
  - パーティションの上限: パーティション範囲分割のパーティション列の最大値を指定します。この値は、テーブル内の行をフィルター処理するためではなく、パーティションのストライドを決定するために使用されます。テーブルまたはクエリ結果のすべての行がパーティション分割され、コピーされます。
  - パーティションの下限: パーティション範囲分割のパーティション列の最小値を指定します。この値は、テーブル内の行をフィルター処理するためではなく、パーティションのストライドを決定するために使用されます。テーブルまたはクエリ結果のすべての行がパーティション分割され、コピーされます。
追加の列: ソースファイルの相対パスまたは静的な値を格納するデータ列を追加します。後者では式がサポートされています。詳細については、「コピー中に列を追加する」を参照してください。

行き先

コピーアクティビティの [変換先] タブの Azure SQL Database では、次のプロパティがサポートされています。

[宛先] タブを示す

次のプロパティは必要です。

データストアの種類: [外部]を選択します。
接続: 接続の一覧から Azure SQL Database 接続を選択します。接続が存在しない場合は、新しいを選択して新しい Azure SQL Database 接続を作成します。
接続の種類: Azure SQL Databaseを選択します。
テーブル: ドロップダウンリストからデータベース内のテーブルを選択します。または、[ 編集] をオンにして、テーブル名を手動で入力します。
データのプレビュー: プレビューデータ を選択して、テーブル内のデータをプレビューします。

[詳細設定で、次のフィールドを指定できます。

書き込み動作: ソースがファイルベースのデータストアのファイルである場合の書き込み動作を定義します。 [挿入]、[アップサート]、または [ストアドプロシージャ] を選択できます。
- 挿入: ソースデータに挿入がある場合は、このオプションを選択します。
- Upsert: ソースデータに挿入と更新の両方がある場合は、このオプションを選択します。
  - TempDBを使用する: アップサートの中間テーブルとしてグローバル一時テーブルと物理テーブルのどちらを使用するかを指定します。既定では、サービスは中間テーブルとしてグローバル一時テーブルを使用し、このチェックボックスがオンになっています。
  - ユーザー DB スキーマの選択: TempDB を使用する] チェックボックスがオンになっていない場合は、物理テーブルを使用する場合に中間テーブルを作成するための中間スキーマを指定します。
    
    手記
    
    テーブルを作成および削除するためのアクセス許可が必要です。既定では、中間テーブルは宛先テーブルと同じスキーマを共有します。
    
    [TempDB の使用] が選択されていないことを示すスクリーンショット
  - キー列: 一意の行識別の列名を指定します。 1 つのキーまたは一連のキーを使用できます。指定しない場合は、主キーが使用されます。
- ストアドプロシージャ: ソースデータをターゲットテーブルに適用する方法を定義するストアドプロシージャを使用します。このストアドプロシージャはバッチごとに呼び出されます。
  - ストアドプロシージャ名: ソーステーブルからデータを読み取る [ の編集] ボックスをオンにするときに、ストアドプロシージャを選択するか、ストアドプロシージャ名を手動で指定します。
  - ストアドプロシージャパラメーター: ストアドプロシージャパラメーターの値を指定します。使用できる値は、名前または値のペアです。パラメーターの名前と大文字と小文字の区別は、ストアドプロシージャパラメーターの名前と大文字と小文字の区別と一致する必要があります。
[一括挿入テーブルロック]: [はい] または [いいえ] を選択します。この設定を使用して、複数のクライアントからのインデックスがないテーブルに対する一括挿入操作中のコピーのパフォーマンスを向上させます。詳細については、BULK INSERT（Transact-SQL）を参照してください。
テーブルオプション: ソーススキーマに基づいてテーブルが存在しない場合、変換先テーブルを自動的に作成するかどうかを指定します。 [なし] または [テーブルの自動作成] を選択します。変換先でストアドプロシージャが指定されている場合、テーブルの自動作成はサポートされません。
コピー前スクリプト: 各実行のコピー先テーブルにデータを書き込む前に、コピーアクティビティを実行するスクリプトを指定します。このプロパティを使用して、事前に読み込まれたデータをクリーンアップできます。
バッチの書き込みタイムアウト: バッチ挿入操作がタイムアウトするまでの待機時間を指定します。使用できる値は timespan です。既定値は "00:30:00" (30 分) です。
バッチサイズの書き込み: バッチごとに SQL テーブルに挿入する行数を指定します。使用できる値は整数 (行数) です。既定では、サービスは行サイズに基づいて適切なバッチサイズを動的に決定します。
最大コンカレント接続: アクティビティの実行中にデータストアに確立される同時接続の上限を指定します。同時接続を制限する場合にのみ値を指定します。
パフォーマンスメトリック分析を無効にする: この設定は、コピーのパフォーマンスの最適化と推奨事項のために、DTU、DWU、RU などのメトリックを収集するために使用されます。この動作に関心がある場合は、このチェックボックスをオンにします。

マッピング

[マッピング] タブの構成で、自動生成テーブル付きの Azure SQL Database を宛先として適用しない場合は、[マッピング] に移動します。

マッピングの構成を除き、Azure SQL Database で「自動作成テーブル」を使用する場合は、ターゲットの列の型を編集することができます。 インポートスキーマを選択した後、変換先で列の種類を指定できます。

たとえば、ソースの列 ID の型は int であり、変換先の列にマッピングするときに float 型に変更できます。

マッピング先の列タイプのスクリーンショット。

設定

設定タブの構成については、設定タブのの下で他の設定を構成するに移動します。

Azure SQL Database からの並列コピー

コピーアクティビティの Azure SQL Database コネクタでは、データを並列にコピーするための組み込みのデータパーティション分割が提供されます。データのパーティション分割オプションは、コピーアクティビティの [ソース] タブにあります。

パーティションコピーを有効にすると、コピーアクティビティによって Azure SQL Database ソースに対して並列クエリが実行され、パーティションごとにデータが読み込まれます。並列度は、[コピーアクティビティの設定] タブでコピーの並列処理の次数によって制御されます。たとえば、コピー並列処理の次数 を 4 に設定すると、指定したパーティションオプションと設定に基づいて 4 つのクエリが同時に生成および実行され、各クエリによって Azure SQL Database からデータの一部が取得されます。

特に Azure SQL Database から大量のデータを読み込む場合は、データパーティション分割を使用して並列コピーを有効にすることをお勧めします。さまざまなシナリオで推奨される構成を次に示します。ファイルベースのデータストアにデータをコピーする場合は、フォルダーに複数のファイルとして書き込む (フォルダー名のみを指定する) ことをお勧めします。この場合、パフォーマンスは 1 つのファイルに書き込むよりも優れています。

シナリオ	推奨される設定
物理パーティションに分割された大きなテーブル全体から読み込む。	パーティションオプション: テーブルの物理パーティション。実行中、サービスは物理パーティションを自動的に検出し、パーティションごとにデータをコピーします。テーブルに物理パーティションがあるかどうかを確認するには、このクエリ参照してください。
物理パーティションがない一方で、データのパーティション分割用に整数または日時の列がある、大きなテーブル全体から読み込む。	パーティションオプション: ダイナミックレンジパーティション。パーティション列 (省略可能): データのパーティション分割に使用する列を指定します。指定しない場合は、インデックスまたは主キー列が使用されます。パーティションの上限とパーティションの下限 (省略可能): パーティションのストライドを決定するかどうかを指定します。これはテーブル内の行をフィルター処理するためのものではありません。テーブル内のすべての行がパーティション分割され、コピーされます。指定しない場合は、コピーアクティビティによって値が自動検出されます。たとえば、パーティション列 "ID" の値の範囲が 1 から 100 の場合、下限を 20 に、上限を 80 に設定し、並列コピーを 4 に設定すると、サービスは、それぞれ 4 つのパーティション (<=20、[21、50]、[51,80]、および >=81 の範囲の ID) でデータを取得します。
物理パーティションを使用せずにカスタムクエリを使用して大量のデータを読み込み、データのパーティション分割には整数列または date/datetime 列を使用します。	パーティションオプション: ダイナミックレンジパーティション。クエリ: `SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>`. パーティション列の: データのパーティション分割に使用する列を指定します。パーティションの上限とパーティションの下限 (省略可能): パーティションのストライドを決定するかどうかを指定します。これはテーブル内の行をフィルター処理するためのものではありません。クエリ結果のすべての行がパーティション分割され、コピーされます。指定しない場合は、コピーアクティビティによって値が自動検出されます。たとえば、パーティション列 "ID" の値の範囲が 1 から 100 の場合、下限を 20 に、上限を 80 に設定し、並列コピーを 4 に設定すると、サービスは、それぞれ 4 つのパーティション ID (<=20、[21、50]、[51,80]、および >=81 の範囲の 4 つのパーティション ID によってデータを取得します。さまざまなシナリオに対するより多くのサンプルクエリを次に示します。 • テーブル全体に対してクエリを実行します。 `SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition` • 列の選択と追加の where 句フィルターを使用したテーブルからのクエリ: `SELECT <column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>` • サブクエリを使用したクエリ: `SELECT <column_list> FROM (<your_sub_query>) AS T WHERE ?DfDynamicRangePartitionCondition AND <your_additional_where_clause>` • サブクエリ内のパーティションを使用したクエリ: `SELECT <column_list> FROM (SELECT <your_sub_query_column_list> FROM <TableName> WHERE ?DfDynamicRangePartitionCondition) AS T`

パーティションオプションを使用してデータを読み込むベストプラクティス:

データスキューを回避するために、パーティション列として固有の列 (主キーや一意キーなど) を選択します。
テーブルに組み込みのパーティションがある場合は、パフォーマンスを向上させるために、テーブル の物理パーティション パーティションオプションを使用します。

物理パーティションを確認するサンプルクエリ

SELECT DISTINCT s.name AS SchemaName, t.name AS TableName, pf.name AS PartitionFunctionName, c.name AS ColumnName, iif(pf.name is null, 'no', 'yes') AS HasPartition
FROM sys.tables AS t
LEFT JOIN sys.objects AS o ON t.object_id = o.object_id
LEFT JOIN sys.schemas AS s ON o.schema_id = s.schema_id
LEFT JOIN sys.indexes AS i ON t.object_id = i.object_id 
LEFT JOIN sys.index_columns AS ic ON ic.partition_ordinal > 0 AND ic.index_id = i.index_id AND ic.object_id = t.object_id 
LEFT JOIN sys.columns AS c ON c.object_id = ic.object_id AND c.column_id = ic.column_id 
LEFT JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id 
LEFT JOIN sys.partition_functions pf ON pf.function_id = ps.function_id 
WHERE s.name='[your schema]' AND t.name = '[your table name]'

テーブルに物理パーティションがある場合は、次のように "HasPartition" が "yes" と表示されます。

SQLクエリの結果です。

テーブルの概要

次の表に、Azure SQL Database のコピーアクティビティの詳細を示します。

ソース

名前	説明	価値	必須	JSON スクリプトプロパティ
データストアの種類	データストアの種類。	外部	はい	/
接続	ソースデータストアへの接続。	<使用している接続>	はい	接続
接続の種類	接続の種類。 Azure SQL Databaseを選択します。	Azure SQL Database	はい	/
テーブル	使用しているソースデータテーブル。	<コピー先テーブルの名前>	はい	スキーマテーブル
クエリを使用する	データを読み取るカスタム SQL クエリ。	•何一つ •クエリ • ストアドプロシージャ	いいえ	• sqlReaderQuery • sqlReaderStoredProcedureName, storedProcedureParameters
クエリタイムアウト	クエリコマンドの実行のタイムアウト。既定値は 120 分です。	timespan	いいえ	queryTimeout
分離レベル	SQL ソースのトランザクションロック動作を指定します。	•何一つ • ReadCommitted • ReadUncommitted • RepeatableRead • シリアライズ可能 •スナップショット	いいえ	分離レベル (isolationLevel)
パーティションオプション	Azure SQL Database からデータを読み込むのに使用されるデータパーティション分割オプション。	•何一つ • テーブルの物理パーティション • Dynamic range	いいえ	パーティションオプション • PhysicalPartitionsOfTable • DynamicRange
追加の列	ソースファイルの相対パスまたは静的値を格納するデータ列を追加します。表現は後者でサポートされています。	•名前 •価値	いいえ	additionalColumns: •名前 •価値

行き先

名前	説明	価値	必須	JSON スクリプトプロパティ
データストアの種類	データストアの種類。	外部	はい	/
接続	コピー先データストアへの接続。	<使用している接続>	はい	接続
接続の種類	接続の種類。 [Azure SQL Database] を選択します。	Azure SQL Database	はい	/
テーブル	あなたの宛先データテーブル。	宛先テーブルの名前 <>	はい	スキーマテーブル
書き込み動作	ソースがファイルベースのデータストアのファイルである場合の書き込み動作を定義します。	•挿入する • アップサート • ストアドプロシージャ	いいえ	writeBehavior: • insert • upsert • sqlWriterStoredProcedureName、sqlWriterTableType、storedProcedureParameters
一括挿入テーブルのロック	この設定を使用して、複数のクライアントからのインデックスがないテーブルに対する一括挿入操作中のコピーのパフォーマンスを向上させます。	イエスかノーか答えてください	いいえ	sqlWriterUseTableLock: 真または偽
テーブルオプション	ソーススキーマに基づいてターゲットテーブルが存在しない場合に、そのテーブルを自動的に作成するかどうかを指定します。	•何一つ • テーブルの自動作成	いいえ	tableOption: • 自動作成
コピー前スクリプト	各実行のコピー先テーブルにデータを書き込む前に実行するコピーアクティビティのスクリプト。このプロパティを使用して、事前に読み込まれたデータをクリーンアップできます。	<コピー前スクリプト> (文字列)	いいえ	preCopyScript
バッチタイムアウトを書き込む	バッチ挿入操作が終了してからタイムアウトするまでの待機時間。使用できる値は timespan です。既定値は "00:30:00" (30 分) です。	時間範囲	いいえ	writeBatchTimeout
書き込みバッチサイズ	バッチごとに SQL テーブルに挿入する行数。既定では、サービスは行サイズに基づいて適切なバッチサイズを動的に決定します。	<行数> (整数)	いいえ	writeBatchSize
最大同時接続数	アクティビティの実行中にデータストアに確立される同時接続の上限。同時接続を制限する場合にのみ値を指定します。	同時接続の上限 <> (整数)	いいえ	最大同時接続数
パフォーマンスメトリック分析を無効にする	この設定は、コピーのパフォーマンスの最適化と推奨事項のために、DTU、DWU、RU などのメトリックを収集するために使用されます。この動作に関心がある場合は、このチェックボックスをオンにします。	選択または選択解除	いいえ	disableMetricsCollection：真または偽

Azure SQL Database 接続を設定する

次の方法で共有

コピー アクティビティで Azure SQL Database を構成する

サポートされている構成

全般

ソース

行き先

マッピング

設定

Azure SQL Database からの並列コピー

物理パーティションを確認するサンプル クエリ

テーブルの概要

ソース

行き先

関連コンテンツ

フィードバック

その他のリソース

コピーアクティビティで Azure SQL Database を構成する

物理パーティションを確認するサンプルクエリ