Databricks 笔记本和 SQL 编辑器中的可视化效果

Azure Databricks 具有功能强大的内置工具,用于在处理笔记本或 SQL 编辑器时直接从数据创建图表和可视化效果。 本页介绍如何在笔记本和 SQL 编辑器中创建、编辑和管理可视化效果。 若要了解 AI/BI 仪表板的可视化效果,请参阅 仪表板可视化效果

若要查看可从笔记本或 SQL 编辑器创建的可视化效果类型,请参阅 可视化类型

生成结果集以可视化

若要生成在此页上使用的结果集,请使用以下代码:

SQL

在 SQL 编辑器中运行以下查询。

USE CATALOG samples;
   SELECT
      hour(tpep_dropoff_datetime) as dropoff_hour,
      COUNT(*) AS num
   FROM samples.nyctaxi.trips
   WHERE pickup_zip in ['10001', '10002']
   GROUP BY 1;

Python语言

从笔记本中的 Python 单元运行以下代码。

from pyspark.sql.functions import hour, col

pickupzip = '10001'  # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
              .groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
              .count() \
              .withColumnRenamed("count", "num")
display(result_df)

创建新的可视化效果

可以在显示结果表的同一 UI 中创建可视化效果。 如果在笔记本环境中工作,还可以生成一个数据概况,该数据概况提供数据帧和表的摘要统计信息和视觉见解。 若要了解有关数据配置文件的详细信息,请参阅 “生成数据配置文件”。

  1. 若要创建可视化效果,请单击 + 结果上方,然后选择 “可视化效果 ”以打开可视化编辑器。

    SQL 编辑器

    显示可视化效果选项的 SQL 编辑器结果表。

    笔记本

    显示“可视化效果”选项的笔记本结果表。

  2. 在“可视化效果类型”下拉菜单中,选择一种类型。 然后,选择要显示在可视化效果中的数据。 可视化效果编辑器

  3. 进行配置选择后,单击“ 保存”。

删除、复制或编辑可视化效果

若要删除、复制或编辑可视化效果或数据配置文件,请单击选项卡名称右侧的向下指向箭头。 还可以从菜单中创建仪表板。

备注

如果单元格包含数据配置文件或运行 SQL 以外的语言,则关联的可视化效果和数据配置文件只能添加到笔记本仪表板。 对于 SQL 单元格,下拉列表中会显示其他 “添加到仪表板 ”菜单项。 请参阅向仪表板添加可视化效果

SQL 编辑器

SQL 编辑器中的可视化菜单选项。

笔记本

笔记本中的可视化菜单选项。

还可以通过直接单击名称并就地编辑名称来重命名选项卡。

编辑可视化效果

要编辑可视化图表:

  1. 单击可视化选项卡中的向下指向箭头。然后单击“ 编辑”。
  2. 使用 可视化编辑器 中的选项卡访问和编辑图表的不同部分。

克隆可视化效果

若要克隆可视化效果,请单击可视化效果选项卡中的向下指向箭头。然后单击“ 复制”。

在可视化效果中启用聚合

对于条形图、折线图、面积图、饼图和热度图,可以直接在可视化效果中添加聚合,而不是修改查询以添加聚合列。 此方法具有以下优点:

  • 无需修改生成结果表的代码。
  • 通过修改聚合,可以快速执行基于方案的数据分析。
  • 聚合适用于整个数据集,而不仅仅是表中显示的前 64,000 行。

聚合可用于以下可视化效果:

  • 线条
  • 酒吧
  • 面积
  • 馅饼
  • 热图
  • 直方图

聚合不支持组合可视化效果,例如在同一图表中显示折线图和条形图。

要为可视化效果聚合 Y 轴列,请执行以下操作:

  1. 通过创建新图表或编辑现有图表来打开可视化编辑器。 如果看到消息 This visualization uses an old configuration. New visualizations support aggregating data directly within the editor,则必须先重新创建可视化效果,然后才能使用聚合。

  2. 在 Y 轴列旁边,为数值类型选择以下聚合类型:

    • 总和(默认)
    • 平均值
    • 计数
    • Count Distinct
    • 麦克斯
    • 最小值
    • 中线

    或者对于字符串类型,可使用以下选项:

    • 计数
    • Count Distinct
  3. 单击“保存” 。 可视化效果展示了聚合的行数。

在某些情况下,你可能不希望在 Y 轴列上使用聚合。 若要关闭聚合,请单击 Kebab menuY 列旁边的 kebab 菜单,然后取消选中使用聚合

编辑可视化效果颜色

可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。

  1. 创建或编辑可视化效果。
  2. 单击“颜色”。
  3. 若要修改颜色,请单击该方块,并执行下列操作之一来选择新颜色:
    • 在颜色选择器中单击颜色。
    • 输入一个十六进制值。
  4. 单击颜色选择器之外的任意位置将其关闭。
  5. 可视化效果编辑器 中单击“保存 以保存更改。

暂时隐藏或显示一个系列

若要在可视化效果中隐藏系列,请单击图例中的系列。 若要再次显示该系列,请在图例中再次单击该系列。

若要仅显示单个系列,请双击图例中的系列。 若要显示其他系列,请单击各个系列。

系列选择

若要选择要在图表上分析的特定序列,请使用以下命令:

  • 单击单个图例项可选择该系列
  • 按 Cmd/Ctrl 并单击图例项可选择或取消选择多个系列

系列选择

已排序的工具提示

使用折线图上的工具提示和按数量级排序的非堆叠条形图,以便更轻松地进行分析。

已排序的工具提示

缩放

对于数据密集的图表,放大单个数据点有助于调查详细信息并裁剪离群值。 若要放大图表,请在画布上单击并拖动。 若要清除缩放,请将鼠标悬停在画布上,然后单击可视化效果右上角的 “清除缩放”按钮。

放大以查看详细信息

以 PNG 文件的形式下载可视化效果

若要将可视化效果加载为 PNG 文件,请将鼠标悬停在画布上,然后单击右上角的下载图标。

单击下载以将可视化效果导出为 PNG 文件

png 文件将下载到设备。

向仪表板添加可视化效果

  1. 单击选项卡名称右侧的向下箭头。
  2. 选择“添加到仪表板”。 此时会显示可用仪表板视图的列表,以及“添加到新仪表板”菜单选项。
  3. 选择仪表板或选择“添加到新仪表板”。 此时会显示仪表板,包括新添加的可视化效果。

旧版可视化效果

默认情况下,图表可视化效果的最新版本处于打开状态。 本节中的设置描述了在使用较旧图表或在最新版本未激活的情况下可能会遇到的旧版可视化效果。

可视化工具

如果将鼠标悬停在可视化编辑器中图表的右上角,将显示一个 Plotly 工具栏,你可以在其中执行选择、缩放和平移等操作。

Plotly 工具栏

如果未看到工具栏,管理员已 禁用工具栏显示

自定义调色板

备注

默认情况下,如果旧仪表板使用自定义调色板,则选择的可视化效果颜色将被忽略。 若要覆盖此设置,请参阅为可视化效果使用不同的调色板