从工作区部署捆绑包并运行工作流

重要

工作区中的 Databricks 资产捆绑包处于 公共预览阶段

可以从本地开发环境或工作区创建和修改属于 Databricks 资产捆绑包的资产,但为了使更改与相应的 Databricks 资源同步,必须部署捆绑包。 捆绑包在工作区中具有唯一标识,因此无论捆绑包是从本地计算机还是工作区部署,捆绑资产都不会重复。

有关在工作区中使用捆绑包的要求,请参阅 工作区要求中的 Databricks 资产捆绑包

有关捆绑包的详细信息,请参阅 什么是 Databricks 资产捆绑包?

部署捆绑包

若要从工作区部署软件包,请执行以下操作。

  1. 导航到工作区中的捆绑包,然后单击捆绑配置 YAML 文件,例如 databricks.yml

  2. 单击“部署”图标。

  3. “部署 ”窗格中,选择目标工作区。 目标工作区在捆绑包的targets映射的databricks.yml中定义。 请参阅 Databricks 资产捆绑包部署模式

    选择目标部署

  4. 单击“部署”。 捆绑包经过验证,验证详细信息将显示在对话框中。

  5. 查看此 “部署到开发 确认”对话框中的部署详细信息,然后单击“ 部署”。

    部署到开发对话框

    重要

    部署捆绑包并运行捆绑包资源以当前用户身份执行代码。 请确保信任捆绑包中的代码,包括 YAML,其中包含运行命令的配置设置。

部署的状态将输出到 “项目输出” 窗口。 部署完成后,部署的捆绑包资源将列在 “捆绑包资源 ”窗格中。

源链接部署

默认情况下,通过工作区将捆绑包部署到开发目标时,部署期间创建的资源会引用工作区中的源文件,而不是引用它们的工作区副本。 文件同步到 ${workspace.file_path} 已被跳过。 如果删除捆绑包,则只会删除捆绑包中定义的资源;文件保持不变。

若要禁用此行为,请在捆绑 databricks.yml 配置文件中 source_linked_deployment 将部署模式预设设置为 false

重要

与源相关联的部署仅适用于工作区中的 Databricks 资产捆绑包。 如果使用 Databricks CLI source_linked_deployment 命令部署捆绑包,则databricks bundle deploy忽略预设。

targets:
  # Disable source_linked_deployment in dev
  dev:
    mode: development
    presets:
      source_linked_deployment: false

有关部署模式的详细信息,请参阅 Databricks 资产捆绑包部署模式

在捆绑包中运行工作流

成功部署捆绑包后,可以触发捆绑包中定义的资源的运行:

  1. 导航到工作区中的捆绑包,然后单击捆绑配置 YAML 文件,例如 databricks.yml

  2. 单击“部署”图标。

    部署图标

  3. “捆绑资源 ”窗格中,单击与任何资源关联的运行图标以运行它。

    列出已部署的资源

协作、审核和部署到生产环境

通过工作区中的 Databricks 资产捆绑包,可以自定义修改、部署和运行捆绑包的权限,以便轻松进行协作和故障排除。 Databricks 建议通过 Git 在捆绑包上进行协作,但为了进行简单的故障排除,可以在 Databricks 工作区中与协作者共享捆绑包。 导航到捆绑项目视图并单击“ 共享”。 捆绑包继承其父 Git 文件夹的权限,因此共享捆绑包会将更改应用于父 Git 文件夹。

开发中完成捆绑包的协作和测试后,请将目标部署更改为 prod 以部署到当前工作区。

注释

如果用户无权访问生产工作区,则无法部署到该工作区。 此外,在使用 UI 部署捆绑包时,不支持跨不同的工作区部署捆绑包。

databricks.yml 配置文件中,为自动部署定义一个用于不同生产环境的工作区。 请参阅 workspace