[ボリュームにアップロードする] UI を使うと、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。 「Unity Catalog ボリュームとは」を参照してください。
5 ギガバイトより大きいファイルをアップロードすることはできません。
- Databricks Runtime 13.3 LTS 以降では、Databricks では、ボリュームを使用して、専用または標準のアクセス モード (以前はシングル ユーザーと共有) を使用したコンピューティング用の
.whl
ライブラリを格納することをお勧めします。
- Databricks Runtime 13.3 LTS 以降では、Databricks では、ボリュームを使用して、専用または標準のアクセス モード (以前はシングル ユーザーと共有) を使用したコンピューティング用の JAR と init スクリプトを格納することをお勧めします。
アップロードしたファイルから Unity Catalog マネージド テーブルを作成できます。 「ボリュームのデータからテーブルを作成する」を参照してください。
ボリュームにアップロードされたファイルに対して、さまざまな機械学習ワークロードとデータ サイエンス ワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (クラスターのライブラリ、ノートブック スコープのライブラリ、ジョブの依存関係を構成するために使う .whl または .txt など) をアップロードできます。
ボリュームにファイルをアップロードするための UI にはどこからアクセスできますか?
この UI には、次の方法でアクセスできます。
- サイドバーで、[新規]>[データの追加]>[ボリュームにファイルをアップロードする] の順にクリックします。
- Catalog Explorer で、追加>ボリュームにアップロードする をクリックします。 Catalog Explorer でボリュームを参照しているときに、ボリュームまたはボリューム内のディレクトリにファイルを直接アップロードすることもできます。
- ノートブック内で、[ファイル]>[ボリュームにファイルをアップロードする] の順にクリックします。
注
ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされています。 Databricks Runtime 12.2 LTS 以前では、/Volumes
パスに対する操作が成功する可能性がありますが、想定どおりに Unity Catalog ボリュームにデータを保持するのではなく、コンピューティング クラスターにアタッチされたエフェメラル ストレージ ディスクにデータが書き込まれる可能性もあります。
開始する前に
Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。
- Unity Catalog が有効になっているワークスペース。 詳細については、「 Unity カタログの概要」を参照してください。
- ファイルのアップロード先のボリュームに対する
WRITE VOLUME
権限。 - 親スキーマに対する
USE SCHEMA
権限 - 親カタログに対する
USE CATALOG
アクセス許可。
詳細については、「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
ボリュームにファイルをアップロードする手順
Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。
- [新規]>[データの追加] の順にクリックします。
- [ボリュームにファイルをアップロードする] をクリックします。
- ボリュームまたはボリューム内のディレクトリを選択するか、ボリューム パスを貼り付けます。
- ターゲット スキーマにボリュームが存在しない場合は、ダイアログを使って新しいボリュームを作成できます。
- 必要に応じて、ターゲット ディレクトリへの完全なパスを指定して、ターゲット ボリューム内に新しいディレクトリを作成できます。
- ブラウザー ボタンをクリックするか、ドロップ ゾーンに直接ファイルをドラッグ アンド ドロップします。
Unity カタログにファイルをアップロードするその他の方法については、「Unity カタログ ボリューム内のファイルを操作する」を参照してください。