Databricks 笔记本是一种基于 Web 的代码编辑器,可用于编写代码并查看用于交互式数据分析的结果。 本页介绍在 Databricks 中使用笔记本的基础知识,包括如何导航工具栏和执行各种单元格操作。
创建笔记本
可以通过多种方式创建新笔记本:
打开笔记本
若要打开笔记本,请使用工作区搜索功能或使用工作区浏览器导航到笔记本,然后单击笔记本的名称或图标。
如果 启用了笔记本和文件的选项卡,则可以 在新选项卡中打开笔记本。
笔记本单元格
笔记本包含两种类型的单元格的集合:代码单元格和 Markdown 单元格。 代码单元包含可运行代码。 Markdown 单元格包含以文本和图形的形式呈现的 Markdown 代码。 使用 Markdown 记录或说明代码。 可以在笔记本中添加或删除任一类型的单元格来构建工作。
可以运行单个单元格、一组单元格或整个笔记本。 笔记本单元最多可以包含 6 MB,其输出限制为 20 MB。
笔记本工具栏图标和按钮
工具栏包含可用于管理和编辑笔记本的菜单和图标。
笔记本名称旁边是用于 更改笔记本的默认语言 的按钮,如果笔记本包含在 Databricks Git 文件夹中,打开 Git 对话框。
若要查看笔记本以前的版本 ,请单击“上次编辑…” 菜单右侧的消息。
下表描述了工具栏右侧的图标和按钮:
图标 | 描述 |
---|---|
![]() ![]() |
运行所有单元格或停止执行。 此按钮的名称会根据笔记本的状态而更改。 |
![]() |
打开计算选择器。 当笔记本连接到群集或 SQL 仓库时,此按钮会显示计算资源的名称。 |
![]() |
打开作业计划程序。 |
![]() |
打开Lakeflow 声明性管道。 仅当笔记本是管道的一部分时,才会显示此按钮。 |
![]() |
打开 权限对话框。 |
右边栏操作
笔记本右侧边栏中提供了多项操作,如下表所述:
图标 | 描述 |
---|---|
![]() |
打开笔记本注释。 |
![]() |
打开 MLflow 笔记本实验。 |
![]() |
打开笔记本版本历史记录。 |
![]() |
打开变量资源管理器。 (适用于 Databricks Runtime 12.2 LTS 及更高版本的 Python 变量。 |
![]() |
打开 Python 环境面板。 此面板显示笔记本可用的所有 Python 库,包括笔记本范围的库、群集库以及 Databricks Runtime 中包含的库。 仅当笔记本附加到群集时才可用。 |
创建单元格
笔记本有两种类型的单元格:代码和 Markdown。 Markdown 单元格的内容将呈现为 HTML 格式。 例如,此代码段包含一级标题的标记:
%md ### Libraries
Import the necessary libraries.
呈现效果如下所示:
若要创建新单元格,请将鼠标悬停在顶部或底部的单元格上。 若要分别创建代码或 Markdown 单元格,请单击 代码 或 文本。
用于创建新单元格 的
单元格操作
通过单元格操作菜单,可以运行、剪切和复制单元格、在笔记本中移动单元格以及隐藏代码或结果。
运行单元格
若要运行代码单元格,请单击代码单元格左上角的向下箭头。
运行单元格后,单元格运行菜单右侧会显示一条通知,其中显示了单元的上次运行时间及其持续时间。 将光标悬停在通知上以获取更多详细信息。
若要默认显示详细的运行信息,请单击右上角的配置文件图像。 然后单击 设置>开发人员>显示详细的命令运行信息。
如果你有表格结果输出,还可以通过将鼠标悬停在 UI 的“上次刷新”部分来访问此信息。
运行所选单元格
可以运行单个单元格或单元格集合。 若要选择单个单元格,请单击单元格内的任意位置。 若要选择多个单元格,请按住 MacOS 上的 Command
键或 Windows 上的 Ctrl
键,然后单击文本区域外的单元格,如屏幕截图中所示。
运行所选单元格,请单击 运行>运行和调试>运行所选单元格,或在 MacOS 上使用快捷键 Command + Enter
,在 Windows 上使用快捷键 Crtl + Enter
。
此命令的行为取决于笔记本附加到的计算资源。
- 在运行 Databricks Runtime 13.3 LTS 或更高版本的计算资源上,将单独执行所选单元格。 如果单元格中发生错误,则将继续执行后续单元格。
- 在运行 Databricks Runtime 14.0 或更高版本的计算资源或 SQL 仓库上,所选单元格将作为批处理执行。 任何错误都将停止执行,并且无法取消单个单元格的执行。 可以使用“中断”按钮停止执行所有单元格。
运行所选文本
可以在笔记本单元中突出显示代码或 SQL 语句,并仅运行突出显示的代码。 在您想要快速迭代代码和查询时,这非常有用。
突出显示要运行的行。
选择 运行 > 运行所选文本 或使用键盘快捷方式
Ctrl
+Shift
+Enter
。 如果未突出显示任何文本,运行所选文本 执行当前行。
如果你在单元格中正在使用编号为
“运行所选文本”还会执行折叠的代码(如果突出显示的选定内容中有任何代码)。
支持特殊单元格命令,例如 %run
、%pip
和 %sh
。
不能在具有多个输出选项卡的单元格(即已定义数据配置文件或可视化效果的单元格)上使用“运行所选文本”。
单元格图标
以下屏幕截图描述了笔记本单元格右上角显示的图标:
语言选择器: 为单元格选择语言。
Databricks 助手:启用或禁用用于在单元格中获取代码建议的 Databricks 助手。
单元格焦点: 放大单元格以使编辑更加轻松。
显示单元格操作菜单: 打开单元格操作菜单。 对于代码和 Markdown 单元格,此菜单中的选项略有不同。
删除单元格
若要删除单元格,请单击单元格右侧的回收站图标。 仅当你将光标悬停在单元格上时,才会显示此图标。
移动单元格
若要向上或向下移动单元格,请单击并按住单元格左侧的拖动手柄图标 。
还可以从单元格操作菜单中选择 上移 或 下移。
剪切、复制和粘贴单元格
有多种选项可用于剪切和复制单元格。 但是,如果使用 Safari 浏览器,则只有键盘快捷方式可用。
- 在单元格操作菜单中选择 剪切单元格 或 复制单元格。
- 使用键盘快捷方式:
Command-X
或Ctrl-X
剪切和Command-C
或Ctrl-C
进行复制。 - 使用笔记本顶部的“编辑”菜单。 选择 剪切 或 复制。
剪切或复制单元格后,可以将这些单元格粘贴到笔记本文件中的其他位置、其他笔记本文件或不同浏览器选项卡或窗口中的笔记本文件中。 若要粘贴单元格,请使用键盘快捷方式 Command-V
或 Ctrl-V
。 单元格将粘贴到当前单元格下方。
若要撤消剪切或粘贴操作,可以使用键盘快捷方式 Command-Z
或 Ctrl-Z
或菜单选项 编辑 > 撤消剪切单元格 或 编辑 > 撤消粘贴单元格。
若要选择相邻单元格,请单击 Markdown 单元格,然后使用 Shift + 向上 或 向下 选择上方或下方的单元格。 使用编辑菜单将所选单元格复制、剪切、粘贴或删除为组。 若要选择所有单元格,请选择 编辑 > 选择所有单元格 或使用命令模式快捷方式 Cmd+A。
添加代码注释
若要向单元格中的代码添加注释,请突出显示代码。 单元格右侧会显示一个注释图标。 单击图标以打开批注框。
为仪表板添加单元格
若要将 Markdown 单元格或具有表格结果的单元格添加到仪表板,请从单元格操作菜单中选择“添加到仪表板”。 有关详细信息,请参阅笔记本中的仪表板。
链接到单元格
若要获取笔记本中特定命令的 URL 链接,请单击 打开焦点模式并从浏览器地址栏中复制 URL。 若要退出焦点模式,请单击
。
打开 Databricks 助手
若要在单元格中打开 Databricks 助手文本框,请单击单元格右上角的 Databricks 助手图标 。
您可以在代码单元中使用它来获得对代码的帮助或建议。 必须在工作区中启用 Databricks 助手。