开发 Databricks 应用

若要使用 Databricks 应用生成数据和 AI 应用,可以使用支持 Python 的任何 IDE,例如 PyCharm、IntelliJ IDEA 或 Visual Studio Code。 Azure Databricks 建议使用用于 Visual Studio Code 的 Databricks 扩展,但也可以在 Databricks 笔记本和文件编辑器中编辑代码。

Databricks 应用环境会自动设置多个环境变量,例如运行应用和身份验证所需的值的 Azure Databricks 工作区的 URL。 许多应用程序还需要自定义配置,例如用于运行应用程序的特定命令或访问 SQL 仓库的参数。 使用 app.yaml 文件定义这些设置。

在本地开发应用:

  • 在首选 IDE 中生成和测试应用。
  • 在本地命令行上运行应用,并在浏览器中预览它。
  • 应用完成并测试后,将代码和所需文件移动到 Azure Databricks 工作区。

使用以下主题来支持应用开发:

主题 说明
定义应用运行时 指定应用如何运行,包括命令、参数和默认设置。
定义环境变量 为身份验证、工作区访问或特定于应用的设置配置环境变量。
管理依赖项 列出文件中用于应用执行的所需 Python 包 requirements.txt
添加资源 包括应用在运行时依赖的静态文件或其他资产。