笔记本输出和结果

将笔记本附加到群集运行一个或多个单元格后,笔记本就会有状态并会显示输出。 此部分介绍如何管理笔记本状态和输出。

清除笔记本状态和输出

要清除笔记本状态和输出,请选择“运行”菜单底部的“清除”选项之一。

菜单选项 描述
清除所有单元格输出 清除单元格输出。 如果共享笔记本并想要避免包含任何结果,这将非常有用。
清除状态 清除笔记本状态,包括函数和变量定义、数据和导入的库。
清除状态和输出 清除单元格输出和笔记本状态。
清除状态并运行全部 清除笔记本状态并启动新的运行。

结果表

运行单元格时,结果将显示在结果表中。 使用结果表,可以执行以下操作:

  • 将一列或表格结果数据的其他部分复制到剪贴板。
  • 对结果表进行文本搜索。
  • 对数据进行排序和筛选
  • 使用键盘箭头键在表格单元格之间导航。
  • 选择列名或单元格值的一部分,方法是双击并拖动以选择所需文本。
  • 使用 列资源管理器 搜索、显示或隐藏、固定和重新排列列。

笔记本结果表

若要查看结果表的限制,请参阅笔记本结果表限制

选择数据

若要在结果表中选择数据,请执行下列操作之一。

  • 将数据或数据子集复制到剪贴板。
  • 单击列或行标题。
  • 单击表格左上角的单元格以选择整个表格。
  • 将光标拖动到任意一组单元格上以选择它们。

若要打开显示所选内容信息的侧面板,请单击“搜索”框旁边右上角的面板图标 面板图标 图标

面板图标的位置

将数据复制至剪贴板

若要将 CSV 格式的结果表复制到剪贴板,请单击表标题选项卡旁边的向下箭头,然后单击“ 将结果复制到剪贴板”。

将结果表复制到剪贴板。

或者,单击表格左上角的框以选择完整表,然后右键单击并从下拉菜单中选择 “复制 ”。

可通过多种方式复制所选数据:

  • 在 MacOS 上按 Cmd + C 或在 Windows 上按 Ctrl + C,以 CSV 格式将结果复制到剪贴板。
  • 右键单击并选择“ 复制 ”,以 CSV 格式将结果复制到剪贴板。
  • 右键单击并选择 “复制方式 ”,以 CSV、TSV 或 Markdown 格式复制所选数据。

将所选数据复制到剪贴板。

对结果进行排序

若要按列中的值对结果表进行排序,请将光标悬停在列名上。 包含列名称的图标显示在单元格右侧。 单击箭头对列进行排序。

如何对列进行排序

若要按多个列进行排序,请按住 Shift 键,同时单击这些列的排序箭头

默认情况下,排序遵循自然排序顺序。 若要实施字典排序顺序,请在 SQL 中使用ORDER BY,或在您的环境中使用相应的SORT函数。

筛选结果

使用结果表上的筛选器来仔细查看数据。 应用于结果表的筛选器还会影响可视化效果,在不修改基础查询或数据集的情况下启用交互式浏览。 请参阅 “筛选可视化效果”。

可通过多种方式创建筛选器:

Databricks 助手

使用助理进行自然语言提示

如果 已启用 Databricks Assistant,则可以使用自然语言提示创建筛选器。

  1. 单击 “筛选”图标。 在单元格结果的右上角。
  2. 在出现的对话框中,输入描述所需筛选器的文本。
  3. 单击“发送”图标。 助手将为你生成并应用筛选器。

如果要使用助手创建其他筛选器,请单击“ 数据库助手”图标。 在筛选器旁输入另一个提示。

请参阅使用自然语言提示筛选数据

“筛选”对话框

使用内置筛选器对话框

  1. 如果未启用 Databricks 助手,请单击单元格结果右上角的 “筛选器”图标 ,打开筛选对话框。 还可以通过单击 “添加筛选器”按钮来访问此对话框。
  2. 选择要筛选的列。
  3. 选择要应用的筛选器规则。
  4. 选择要筛选的值。

筛选器示例

按值

按特定值进行筛选

  1. 在结果表中,右键单击具有该值的单元格。
  2. 从下拉菜单中选择“ 按此值筛选 ”。

特定值

按列

在特定列上筛选

  1. 将鼠标悬停在要筛选的列上。
  2. 单击“Kebab”菜单图标。
  3. 单击筛选
  4. 选择要筛选的值。

筛选 kebab 菜单

若要暂时启用或禁用筛选器,请在对话框中切换“启用/禁用”按钮

若要删除筛选器,请单击“ 关闭”图标。 在筛选器名称旁 删除筛选器 X

将筛选器应用于完整数据集

默认情况下,筛选器仅应用于结果表中显示的结果。 如果返回的数据被截断(例如,当查询返回的行数超过 10,000 行或数据集大于 2MB 时),筛选器将仅应用于返回的行。 表右上角的注释指示筛选器已应用于截断的数据。

你可以改为选择筛选完整数据集。 单击 截断的数据,然后选择 完整数据集。 根据数据集的大小,可能需要很长时间才能应用筛选器。

将筛选器应用于完整数据集。

从筛选的结果创建查询

在以 SQL 作为 默认语言的笔记本中,从筛选结果表或可视化中,可以创建应用筛选器的新查询。 在表或可视化效果的右上角,单击“ 创建查询”。 查询将作为下一个单元格添加到笔记本中。

创建的查询将筛选器叠加于原始查询。 这样,就可以使用更小、更相关的数据集,从而实现更高效的数据浏览和分析。

展示如何从筛选结果中创建查询的 GIF 动图。 s

探索列

为了便于处理包含多个列的表,可以使用列资源管理器。 要打开列浏览器,请点击结果表右上角的“列图标”(列图标)。

使用列资源管理器可以:

  • 搜索列:在搜索栏中键入以筛选列的列表。 单击资源管理器中的列,在结果表中导航到它。
  • 显示或隐藏列:使用复选框控制列可见性。 顶部的复选框可同时切换所有列的可见性。 可以使用名称旁边的复选框显示或隐藏各个列。
  • 固定列:将鼠标悬停在列名上以显示固定图标。 单击固定图标以固定列。 在结果表中水平滚动时,固定的列保持可见。
  • 重新排列列:单击并按住列名称右侧的拖动图标(拖动图标)。然后将该列拖放到其新的所需位置。 这会对结果表中的列重新排序。

使用列资源管理器搜索、显示或隐藏、固定和重新排列列。

设置列格式

列标题指示列的数据类型。 例如,整数类型列的指示器 指示整数数据类型。 将鼠标悬停在指示器上可查看数据类型。

可以将结果表中列的格式设置为货币、百分比、URL 等类型,控制小数位数,让表格内容更清晰。

在列名称中使用 Kebab 菜单设置列格式。

用于设置列格式的 Kebab 菜单

下载结果

默认情况下已启用“下载结果”。 若要切换此设置,请参阅管理从笔记本下载结果的功能

可以将包含表格输出的单元格结果下载到本地计算机。 单击选项卡标题旁边的向下箭头。 菜单选项取决于结果中的行数和 Databricks Runtime 版本。 下载的结果以 CSV 文件的形式保存在本地计算机上,该文件的名称与笔记本名称相对应。

下载单元格结果。

对于连接到 SQL 仓库或无服务器计算的笔记本,还可以将结果下载为 Excel 文件。

将所有行下载到 Excel 文件。

浏览 SQL 单元格结果

在 Databricks 笔记本中,SQL 语言单元格的结果自动作为分配给变量 _sqldf的数据帧提供。 可以使用变量 _sqldf 引用后续 Python 和 SQL 单元格中的上一个 SQL 输出。 有关详细信息,请参阅 “浏览 SQL 单元格结果”。

查看每个单元格的多个输出

Python 笔记本以及非 Python 笔记本中的 %python 单元格支持每个单元格多个输出。 例如,以下代码的输出包括绘图和表:

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

调整输出大小

通过拖动表格或可视化效果的右下角调整单元格输出的大小。

通过拖动右下角调整输出表的大小。

在 Databricks Git 文件夹中提交笔记本输出

要了解如何提交 .ipynb 笔记本输出,请参阅允许提交 .ipynb 笔记本输出

  • 笔记本必须是 .ipynb 文件
  • 工作区管理员设置必须允许提交笔记本输出