このページでは、Azure Databricks でノートブックをインポートおよびエクスポートする方法と、Azure Databricks でサポートされているノートブック形式について説明します。
サポートされているノートブック形式
Databricks ではノートブックを次の形式でインポートおよびエクスポートできます。
- ソース ファイル: 拡張子が
.scala
、.py
、.sql
、または.r
のソース コード ステートメントのみを含むファイル。 - HTML: 拡張子が
.html
の Azure Databricks ノートブック。 - Databricks
.dbc
アーカイブ。 - IPython ノートブック: 拡張子が の
.ipynb
。 - RMarkdown: 拡張子が の
.Rmd
。
ノートブックをインポートする
URL またはファイルから外部ノートブックをインポートできます。 Azure Databricks ワークスペースから一括エクスポートされたノートブックの ZIP アーカイブをインポートすることもできます。
- サイドバーで、
[ワークスペース] をクリックします。 次のいずれかの操作を行います。
- フォルダーを右クリックし、[インポート] を選択します。
- 現在のワークスペース フォルダーの最上位レベルにあるノートブックをインポートするには、右上にある kebab メニューをクリックし、[インポート] を選択します。
- URL を指定するか、サポートされている外部形式、または Azure Databricks ワークスペースからエクスポートされたノートブックの ZIP アーカイブを含むファイルを参照します。
-
[インポート] をクリックします。
- 1 つのノートブックを選択すると、現在のフォルダーにエクスポートされます。
- DBC または ZIP アーカイブを選択すると、そのフォルダー構造が現在のフォルダーに再作成され、各ノートブックがインポートされます。
ファイルをノートブックに変換する
ワークスペース内の資産は、 .ipynb
拡張子を持つ場合、または最初の行のコメントに文字列 Databricks notebook source
が含まれており、 .py
、 .r
、 .scala
、 .sql
のいずれかの拡張子を持つ場合、ノートブックとして識別されます。 これらの条件を変更するノートブックまたはファイルの書き込みまたは名前変更は、ノートブックまたはファイルの種類も変更します。 たとえば、1 行目が myfile.txt
である # Databricks notebook source
ファイルがある場合、そのファイルの名前を myfile.py
に変更すると、ノートブックに変換されます。
注意
ノートブックの IPYNB またはソース形式が特定の場合、ファイルとノートブックの種類を変換すると、予期しない結果が生じる可能性があります。 「ノートブックの形式」を参照してください。
Python、SQL、Scala、R スクリプトを単一セルノートブックに変換するには、ファイルの最初のセルにコメントを追加します。
Python(プログラミング言語)
# Databricks notebook source
SQL
-- Databricks notebook source
スカラ (プログラミング言語)
// Databricks notebook source
R
# Databricks notebook source
スクリプトでセルを定義するには、次に示す特別なコメントを使用します。 スクリプトを Databricks にインポートすると、示されている COMMAND
行でマークされたセルが作成されます。
Python(プログラミング言語)
# COMMAND ----------
SQL
-- COMMAND ----------
スカラ (プログラミング言語)
// COMMAND ----------
R
# COMMAND ----------
ノートブックをエクスポートする
注意
ノートブックを HTML、IPython ノートブック (.ipynb)、またはアーカイブ (DBC) としてエクスポートし、コマンド出力を消去していない場合は、その出力がエクスポートに含まれます。
ノートブックをエクスポートするには、ノートブック ツール バーの [ファイル] > [エクスポート] を選び、エクスポート形式を選びます。
ワークスペース フォルダー内のすべてのフォルダーを ZIP アーカイブとしてエクスポートするには:
サイドバーで、
[ワークスペース] をクリックします。
フォルダーを右クリックし、[エクスポート] を選択します。
エクスポート形式を選択します。
- DBC アーカイブ: Databricks アーカイブをエクスポートします。これは、メタデータとノートブック コマンドの出力を含むバイナリ形式です。
- ソース ファイル: ノートブック ソース ファイルの ZIP アーカイブをエクスポートします。これは、Azure Databricks ワークスペースにインポートしたり、CI/CD パイプラインで使用したり、各ノートブックの既定の言語でソース ファイルとして表示したりできます。 ノートブック コマンドの出力は含まれません。
- HTML アーカイブ: HTML ファイルの ZIP アーカイブをエクスポートします。 各ノートブックの HTML ファイルは、Azure Databricks ワークスペースにインポートすることも、HTML として表示することもできます。 ノートブック コマンドの出力が含まれています。