若要使用 Databricks 应用生成数据和 AI 应用,可以使用支持 Python 的任何 IDE,例如 PyCharm、IntelliJ IDEA 或 Visual Studio Code。 Azure Databricks 建议使用用于 Visual Studio Code 的 Databricks 扩展,但也可以在 Databricks 笔记本和文件编辑器中编辑代码。
Databricks 应用环境会自动设置多个环境变量,例如运行应用和身份验证所需的值的 Azure Databricks 工作区的 URL。 许多应用程序还需要自定义配置,例如用于运行应用程序的特定命令或访问 SQL 仓库的参数。 使用 app.yaml
文件定义这些设置。
在本地开发应用:
- 在首选 IDE 中生成和测试应用。
- 在本地命令行上运行应用,并在浏览器中预览它。
- 应用完成并测试后,将代码和所需文件移动到 Azure Databricks 工作区。
使用以下主题来支持应用开发:
主题 | 说明 |
---|---|
定义应用运行时 | 指定应用如何运行,包括命令、参数和默认设置。 |
定义环境变量 | 为身份验证、工作区访问或特定于应用的设置配置环境变量。 |
管理依赖项 | 列出文件中用于应用执行的所需 Python 包 requirements.txt 。 |
添加资源 | 包括应用在运行时依赖的静态文件或其他资产。 |