Databricks ノートブックは、対話型のデータ分析のためにコードを記述し、結果を表示できる Web ベースのコード エディターです。 このページでは、ツール バー内を移動してさまざまなセル操作を実行する方法など、Databricks でノートブックを使用する方法の基本について説明します。
ノートブックを作成する
新しいノートブックは、いくつかの方法で作成できます。
ノートブックを開く
ノートブックを開くには、ワークスペース 検索機能 を使用するか、ワークスペース ブラウザーを使用して ノートブックに移動 し、ノートブックの名前またはアイコンをクリックします。
ノートブックとファイルのタブが有効になっている場合は、新しいタブでノートブックを開くことができます。
ノートブックのセル
ノートブックには、コード セルと Markdown セルの 2 種類のセルのコレクションが含まれています。 コード セルには実行可能なコードが含まれています。 Markdown セルには、テキストとグラフィックスとしてレンダリングされる Markdown コードが含まれています。 Markdown を使用してコードを文書化または説明します。 いずれかの種類のセルをノートブックに追加または削除して、作業を構成できます。
1 つのセル、セルのグループ、またはノートブック全体を実行できます。 ノートブック セルには最大 6 MB を含めることができます。出力は 20 MB に制限されています。
ノートブックのツール バーのアイコンとボタン
ツール バーには、ノートブックの管理と編集に使用できるメニューとアイコンが含まれています。
ノートブック名の横には、 ノートブックの既定の言語を変更 するためのボタンがあり、ノートブックが Databricks Git フォルダーに含まれている場合は、 Git ダイアログを開きます。
以前の バージョン のノートブックを表示するには、[最終編集]をクリックします。 メッセージがメニューの右側に表示されます。
ツールバーの右側にあるアイコンとボタンを次の表に示します。
アイコン | 説明 |
---|---|
![]() ![]() |
すべてのセルを実行するか、実行を停止します。 このボタンの名前は、ノートブックの状態によって変わります。 |
![]() |
コンピューティング セレクターを開きます。 ノートブックがクラスターまたは SQL ウェアハウスに接続されている場合、このボタンにはコンピューティング リソースの名前が表示されます。 |
![]() |
ジョブ スケジューラを開きます。 |
![]() |
Lakeflow 宣言型パイプラインを開きます。 このボタンは、ノートブックがパイプラインの一部である場合にのみ表示されます。 |
![]() |
アクセス許可ダイアログを開く。 |
右サイドバーアクション
次の表に示すように、ノートブックの右サイドバーからいくつかのアクションを使用できます。
アイコン | 説明 |
---|---|
![]() |
ノートブックのコメントを開きます。 |
![]() |
MLflow ノートブックの実験を開きます。 |
![]() |
ノートブックのバージョン履歴を開きます。 |
![]() |
変数エクスプローラーを開きます。 (Databricks Runtime 12.2 LTS 以降の Python 変数で使用できます)。 |
![]() |
Python 環境パネルを開きます。 このパネルには、ノートブックスコープのライブラリ、クラスター ライブラリ、Databricks ランタイムに含まれるライブラリなど、ノートブックで使用できるすべての Python ライブラリが表示されます。 ノートブックがクラスターにアタッチされている場合にのみ使用できます。 |
セルを作成する
ノートブックには、コードと Markdown という 2 種類のセルがあります。 Markdown セルの内容は HTML にレンダリングされます。 たとえば、次のスニペットには、レベル 1 の見出しのマークアップが含まれています。
%md ### Libraries
Import the necessary libraries.
次のようにレンダリングされます。
新しいセルを作成するには、上部または下部のセルにマウス ポインターを合わせます。 [ コード ] または [テキスト] をクリックして、それぞれコードセルまたは Markdown セルを作成します。
セル操作
セルアクションメニューでは、セルの実行、切り取り、コピー、ノートブック内のセルの移動、コードまたは結果の非表示を切り替えます。
セルを実行する
コード セルを実行するには、コード セルの左上にある下矢印をクリックします。
セルが実行されると、セルの実行メニューの右側に通知が表示され、最後にセルが実行された時刻とその期間が表示されます。 通知の上にカーソルを置くと、詳細が表示されます。
既定で詳細な実行情報を表示するには、右上にあるプロファイル画像をクリックします。 次に、[>>する] をクリックします。
表形式の結果出力がある場合は、UI の [最終更新] セクションにマウス ポインターを合わせると、この情報にアクセスすることもできます。
選択したセルを実行する
1 つのセルまたはセルのコレクションを実行できます。 1 つのセルを選択するには、セル内の任意の場所をクリックします。 複数のセルを選択するには、MacOS の Command
キーまたは Windows の Ctrl
キーを押しながら、スクリーンショットに示すようにテキスト領域の外側にあるセルをクリックします。
選択したセルを実行するには、[実行>実行してデバッグ>選択したセルを実行するか、MacOS または Windows のCommand + Enter
のキーボード ショートカット Crtl + Enter
を使用します。
このコマンドの動作は、ノートブックがアタッチされているコンピューティング リソースによって異なります。
- Databricks Runtime 13.3 LTS 以下を実行しているコンピューティング リソースでは、選択したセルが個別に実行されます。 セルでエラーが発生した場合、実行は後続のセルで続行されます。
- Databricks Runtime 14.0 以上を実行しているコンピューティング リソース、または SQL ウェアハウス上で、選択したセルがバッチとして実行されます。 エラーが発生すると実行が停止し、個々のセルの実行を取り消すことはできません。 割り込み ボタンを使用すると、すべてのセルの実行を停止できます。
選択したテキストを実行する
ノートブック セル内のコードまたは SQL ステートメントを強調表示し、強調表示されたコードのみを実行できます。 これは、コードとクエリをすばやく反復処理する場合に便利です。
実行する行を強調表示します。
[ 実行] > 選択したテキストを実行 するか、キーボード ショートカット
Ctrl
+Shift
+Enter
を使用します。 テキストが強調表示されていない場合、 選択したテキストを実行 すると、現在の行が実行されます。
セルで混合言語を使用している場合は、選択範囲に%<language>
行を含める必要があります。
選択したテキストを実行 すると、強調表示された選択範囲に折りたたまれたコードがある場合も実行されます。
%run
、%pip
、%sh
などの特殊なセル コマンドがサポートされています。
複数の出力タブを持つセル (つまり、データ プロファイルまたは視覚化を定義したセル) では、[ 選択したテキストを実行 ] を使用することはできません。
セル アイコン
次のスクリーンショットは、ノートブック セルの右上に表示されるアイコンを示しています。
言語セレクター: セルの言語を選択します。
Databricks Assistant: セル内のコード候補に対して Databricks Assistant を有効または無効にします。
セルフォーカス: セルを拡大すると、編集が簡単になります。
セルの操作メニューを表示する: セルの操作メニューを開きます。 このメニューのオプションは、コード セルと Markdown セルで若干異なります。
セルを削除する
セルを削除するには、セルの右側にあるごみ箱アイコンをクリックします。 このアイコンは、セルの上にカーソルを置くと表示されます。
セルを移動する
セルを上下に移動するには、ドラッグ ハンドル アイコンの をクリックしたままセルの左側に移動します。
セルの操作メニューから[ 上へ移動 ]または [下へ移動 ]を選択することもできます。
セルの切り取り、コピー、貼り付け
セルの切り取りとコピーには、いくつかのオプションがあります。 ただし、Safari ブラウザーを使用している場合は、キーボード ショートカットのみを使用できます。
- セルの操作メニューから、[ セルの切り取り ] または [ セルのコピー] を選択します。
- キーボード ショートカットを使用して、
Command-X
またはCtrl-X
で切り取り、Command-C
またはCtrl-C
でコピーできます。 - ノートブックの上部にある [編集] メニューを使用します。 [ 切り取り ] または [ コピー] を選択します。
セルを切り取ったりコピーしたりしたら、ノートブック内の別の場所、別のノートブック、または別のブラウザー タブまたはウィンドウ内のノートブックに、それらのセルを貼り付けることができます。 セルを貼り付けるには、キーボード ショートカット Command-V
または Ctrl-V
を使用します。 セルは現在のセルの下に貼り付けられます。
切り取りまたは貼り付けの操作を元に戻すには、キーボード ショートカットのCommand-Z
またはCtrl-Z
を使用するか、メニュー オプションの [切り取りを元に戻す] または [元に戻す>セルを元に戻す] または [貼り付け元に戻す] >使用できます。
隣接するセルを選択するには、Markdown セルをクリックし、 Shift + Up または Down を使用して、その上または下のセルを選択します。 編集メニューを使用して、選択したセルをグループとしてコピー、切り取り、貼り付け、または削除します。 すべてのセルを選択するには、[ 編集] > [すべてのセルを選択 ] を選択するか、コマンド モードのショートカット Cmd + A を使用します。
コード コメントを追加する
セル内のコードにコメントを追加するには、コードを強調表示します。 セルの右側にコメント アイコンが表示されます。 アイコンをクリックしてコメント ボックスを開きます。
ダッシュボードにセルを追加する
Markdown セルまたは表形式の結果を含むセルをダッシュボードに追加するには、セルのアクション メニューから [ ダッシュボードに追加] を選択します。 詳細については、「 ノートブックのダッシュボード」を参照してください。
セルへのリンク
ノートブック内の特定のコマンドへの URL リンクを取得するには、 をクリックしてフォーカス モードを開き、ブラウザーのアドレス バーから URL をコピーします。 フォーカス モードを終了するには、[
をクリックします。
Databricks Assistant を開く
セルで Databricks Assistant テキスト ボックスを開くには、セルの右上隅にある Databricks Assistant アイコン をクリックします。
コード セルでこれを使用して、コードのヘルプや提案を取得できます。 ワークスペースで Databricks Assistant を有効にする必要があります。