次の方法で共有


ノートブックの出力と結果

ノートブックをクラスターにアタッチして 1 つ以上のセルを実行すると、そのノートブックが状態を持つようになり、出力が表示されます。 このセクションでは、ノートブックの状態と出力を管理する方法について説明します。

ノートブックの状態と出力を消去する

ノートブックの状態と出力をクリアするには、[実行] メニューの下部にある Clear オプションのいずれかを選択します。

メニュー オプション 説明
すべてのセル出力をクリアする セルの出力をクリアします。 これは、ノートブックを共有し、結果は含まれないようにする場合に便利です。
状態をクリアする 関数と変数の定義、データ、インポートされたライブラリなど、ノートブックの状態をクリアします。
状態と結果をクリアする セル出力とノートブックの状態をクリアします。
状態をクリアしてすべて実行する ノートブックの状態をクリアし、新しい実行を開始します。

結果テーブル

セルを実行すると、結果テーブルに結果が表示されます。 結果テーブルでは、次の操作を行うことができます。

  • 表形式の結果データの列またはその他のサブセットをクリップボードにコピーします。
  • 結果テーブルでテキスト検索を実行します。
  • データの並べ替えとフィルター処理を行います
  • キーボードの方向キーを使用して、表のセル間を移動します。
  • 列名またはセルの値の一部を選択するには、ダブルクリックしてドラッグし、目的のテキストを選択します。
  • 列エクスプローラーを使用して、列の検索、表示/非表示、ピン留め、並べ替えを行います。

ノートブック結果テーブル

結果テーブルの制限を表示するには、ノートブックの結果テーブルの制限を参照してください。

データを選択する

結果テーブルのデータを選択するには、次のいずれかの操作を行います。

  • データまたはデータのサブセットをクリップボードにコピーします。
  • 列または行ヘッダーをクリックします。
  • テーブルの左上のセルをクリックして、テーブル全体を選択します。
  • 任意のセル セットにカーソルをドラッグして選択します。

選択したものに関する情報を示すサイド パネルを開くには、右上端で panel iconpanel icon[検索] ボックスの横にある、パネル アイコン ( アイコン) をクリックします。

パネル アイコンの場所

データをクリップボードにコピーする

CSV 形式の結果テーブルをクリップボードにコピーするには、[テーブル タイトル] タブの横にある下向き矢印をクリックし、[ 結果をクリップボードにコピー] をクリックします。

結果テーブルをクリップボードにコピーします。

または、テーブルの左上にあるボックスをクリックして完全なテーブルを選択し、右クリックしてドロップダウン メニューから [コピー ] を選択します。

選択したデータをコピーするには、いくつかの方法があります。

  • MacOS で Cmd + C キーを押すか、Windows で Ctrl + C を押して、結果を CSV 形式でクリップボードにコピーします。
  • 右クリックして [ コピー ] を選択し、結果を CSV 形式でクリップボードにコピーします。
  • 選択したデータを CSV、TSV、または Markdown 形式でコピーするには、右クリックして [ コピー] を選択します。

選択したデータをクリップボードにコピーします。

結果の並べ替え

列の値で結果テーブルを並べ替えるには、列名の上にカーソルを置きます。 セルの右側に列名を含むアイコンが表示されます。 矢印をクリックして列を並べ替えます。

列 を並べ替える方法

複数の列で並べ替えるには、Shift キーを押しながら列の並べ替え矢印をクリックします。

既定では、並べ替えは自然な並べ替え順序に従います。 辞書式の並べ替え順序を適用するには、SQL で ORDER BY を使用するか、環境内で使用可能なそれぞれの SORT 関数を使用します。

結果のフィルター処理

結果テーブルのフィルターを使用して、データを詳しく調べます。 結果テーブルに適用されるフィルターは視覚化にも影響を与え、基になるクエリやデータセットを変更せずに対話型の探索を有効にします。 ビジュアライゼーションのフィルター処理を行う方法をご覧ください。

フィルターを作成するには、いくつかの方法があります。

Databricks Assistant

アシスタントで自然言語プロンプトを使用する

Databricks Assistant を有効にしている場合は、自然言語プロンプトを使用してフィルターを作成できます。

  1. セルの結果の右上にある [ フィルター] アイコン をクリックします。
  2. 表示されるダイアログで、目的のフィルターを説明するテキストを入力します。
  3. [ 送信] アイコンをクリックします。 アシスタントによってフィルターが生成され、適用されます。

アシスタントを使用して追加のフィルターを作成する場合は、[ DB アシスタント] アイコン をクリックします。フィルターの横にある別のプロンプトを入力します。

自然言語プロンプトでデータをフィルター処理する」を参照してください。

[フィルター] ダイアログ

組み込みのフィルター ダイアログを使用する

  1. Databricks Assistant が有効になっていない場合は、[ フィルター] アイコン をクリックします。セルの結果の右上にあるフィルター ダイアログを開きます。 このダイアログには、[ フィルターの追加] ボタンをクリックしてアクセスすることもできます。
  2. フィルター処理する列を選択します。
  3. 適用するフィルター規則を選択します。
  4. フィルター処理する値を選択します。

フィルターの例

値別

特定の値でフィルター処理する

  1. 結果テーブルから、その値を持つセルを右クリックします。
  2. ドロップダウン メニューから [ この値でフィルター] を選択します。

特定の値

列ごとに

特定の列にフィルターを適用する

  1. フィルターを適用する列にカーソルを合わせます。
  2. [ Kebab] メニュー アイコンをクリックします。
  3. フィルター をクリックします。
  4. フィルター処理する値を選択します。

フィルターのケバブ メニュー

フィルターを一時的に有効または無効にするには、ダイアログの [有効/無効] ボタンを切り替えます。

フィルターを削除するには、[ 閉じる] アイコン をクリックします。フィルター名削除 フィルター X の横にあります。

完全なデータセットにフィルターを適用する

既定では、フィルターは結果テーブルに表示される結果にのみ適用されます。 返されたデータが切り捨てられる場合 (たとえば、クエリから 10,000 行を超える行が返された場合、またはデータセットが 2 MB を超える場合)、フィルターは返された行にのみ適用されます。 テーブルの右上にあるメモは、フィルターが切り捨てられたデータに適用されたことを示しています。

代わりに、完全なデータセットをフィルター処理することもできます。 [Truncated data] (切り捨てられたデータ) をクリックし、[Full dataset] (データセット全体) を選びます。 データセットのサイズによっては、フィルターが適用されるまでに時間がかかる場合があります。

完全なデータセットにフィルターを適用します。

フィルター処理された結果からクエリを作成する

既定の言語として SQL を使用するノートブックのフィルター処理された結果テーブルまたは視覚化から、フィルターが適用された新しいクエリを作成できます。 テーブルまたは視覚化の右上にある [ クエリの作成] をクリックします。 クエリがノートブックの次のセルとして追加されます。

作成されたクエリは、元のクエリの上にフィルターを適用します。 これにより、より小さく関連性の高いデータセットを操作できるため、より効率的なデータ探索と分析が可能になります。

フィルター処理された結果からクエリを作成する方法を示す Gif。

列を探索する

列が多いテーブルの操作を容易にするために、列エクスプローラーを使用できます。 列エクスプローラーを開くには、結果テーブルの右上にある列アイコン (列アイコン)をクリックします。

列エクスプローラーを使用すると、次のことができます。

  • 列を検索する: 検索バーに入力して列の一覧をフィルター処理します。 エクスプローラーで列をクリックして、結果テーブル内の列に移動します。
  • 列の表示/非表示: チェック ボックスを使用して列の表示を制御します。 上部のチェック ボックスをオンにすると、すべての列の可視性が一度に切り替わります。 個々の列は、名前の横にあるチェック ボックスを使用して表示または非表示にすることができます。
  • 列をピン留めする: 列名にカーソルを合わせると、ピン アイコンが表示されます。 ピン アイコンをクリックして列をピン留めします。 結果テーブルを水平方向にスクロールしても、ピン留めされた列は表示されたままです。
  • 列を並べ替える: ドラッグ アイコン (ドラッグ アイコン)をクリックしたまま列の名前の右側に移動し、列を新しい目的の位置にドラッグ アンド ドロップします。 これにより、結果テーブルの列の順序が変更されます。

列エクスプローラーを使用して、列の検索、表示/非表示、ピン留め、並べ替えを行います。

列の書式設定

列ヘッダーは、列のデータ型を示します。 たとえば、整数型の列の インジケーター 整数データ型を示します。 インジケーターをマウスでポイントすると、データ型が表示されます。

結果テーブルの列は、CurrencyPercentageURL などの型として書式設定でき、より明確なテーブルの小数点以下の桁数を制御できます。

列名のケバブ メニューで、列の書式を設定します。

列の書式を設定するケバブ メニュー

結果のダウンロード

既定では、結果のダウンロードは有効です。 この設定を切り替えるには、「ノートブックから結果をダウンロードする機能を管理する」を参照してください。

表形式の出力が含まれているセル結果をローカル コンピューターにダウンロードできます。 タブ タイトルの横にある下向き矢印をクリックします。 メニューのオプションは、結果の行数と Databricks Runtime のバージョンによって異なります。 ダウンロードした結果は、ノートブック名に対応する名前を持つ CSV ファイルとしてローカル コンピューターに保存されます。

セルの結果をダウンロードします。

SQL ウェアハウスまたはサーバーレス コンピューティングに接続されているノートブックの場合は、結果を Excel ファイルとしてダウンロードすることもできます。

すべての行を Excel ファイルにダウンロードします。

SQL セルの結果を調べる

Databricks ノートブックでは、SQL 言語セルからの結果は、変数 _sqldfに割り当てられた DataFrame として自動的に使用できます。 _sqldf変数を使用して、後続の Python および SQL セルの前の SQL 出力を参照できます。 詳細については、「 EXPlore SQL セルの結果を参照してください。

セルごとに複数の出力を表示する

Python ノートブックと、Python 以外のノートブックの %python セルでは、セルごとに複数の出力がサポートされます。 たとえば、次のコードの出力には、プロットとテーブルの両方が含まれます。

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

出力のサイズを変更する

テーブルまたは視覚化の右下隅をドラッグして、セル出力のサイズを変更します。

右下隅をドラッグして出力テーブルのサイズを変更します。

Databricks Git フォルダーでノートブックの出力をコミットする

.ipynb ノートブック出力のコミットの詳細については、「.ipynb ノートブック出力のコミットを許可する」を参照してください。

  • ノートブックは .ipynb ファイルである必要があります
  • ワークスペース管理者の設定では、ノートブックの出力をコミットできるようにする必要があります