Databricks 应用使开发人员能够直接在 Azure Databricks 平台上生成和部署安全数据和 AI 应用程序,无需单独的基础结构。 应用托管在 Azure Databricks 无服务器平台上,并与关键平台服务集成,其中包括:
- 用于数据治理的 Unity Catalog
- 用于查询数据的 Databricks SQL
- 用于部署 AI 模型的模型服务
- 适用于 ETL 和自动化的 Lakeflow 任务
- 用于身份验证和授权的 OAuth 和服务主体
可以在本地开发应用,将其部署到工作区,并在工作区之间移动它们。 此托管模型无需开发人员处理安全性、基础结构和合规性,从而简化了将内部数据工具引入生产的过程。
Databricks 应用支持 Python 框架,如 Streamlit、Dash 和 Gradio。 有关在 Databricks 应用 UI 中使用常用 Python 框架的示例,请参阅 开发 Databricks 应用。
有关 Databricks 应用定价的信息,请参阅“应用计算”。
常见用例
Databricks 应用适用于合并数据、AI 和自动化的内部工具。 示例用例包括:
- 交互式数据可视化效果和嵌入式商业智能(BI)仪表板
- 由 Genie 提供支持的 Retrieval-Augmented 代(RAG)聊天应用
- Lakeflow 的自定义配置接口
- Databricks SQL 支持的数据输入表单
- 将多个 Azure Databricks 服务组合在一起的业务流程自动化
- 自定义操作工具用于警报分类和响应
限制
- 应用文件不能超过 10 MB。 如果应用目录中的任何文件超过此限制,部署将失败并出现错误。
- Azure Databricks 在终止运行应用的计算资源时删除应用日志。 请参阅 您的 Databricks 应用日志。
- 如果通过 用户授权向应用授予许可,则以后无法撤销该同意。
- 标准层工作区不支持 Databricks 应用。
- 可以在 Azure Databricks 工作区中创建有限数量的应用。 有关详细信息,请参阅 资源限制。 有关免费版限制,请参阅 Databricks Free Edition 限制。
- 由于它们不支持 OAuth,因此不能对 Databricks Apps 使用 旧区域 URL 。
Databricks Apps 系统环境
注意
若要查看特定应用的环境(包括环境变量和已安装的包),请转到 应用详细信息页上的“环境 ”选项卡。 请参阅 查看 Databricks 应用的详细信息。
下面介绍了应用在其中运行的系统环境。 有关随应用预安装的 Python 包的列表,请参阅 Databricks 应用中的“定义环境变量”。
- 操作系统:Ubuntu 22.04 LTS
- Python 环境:Python 3.11.0,在专用虚拟环境中运行。 所有依赖项都在此环境中隔离,包括使用
requirements.txt
文件安装的库和预装库。 - 系统资源:每个应用最多可以使用 2 个虚拟 CPU(vCPU)和 6 GB 内存。 如果应用超出这些限制,Azure Databricks 可能会重启它。
合规性标准支持
下表列出了 Databricks 应用支持的符合性标准以及每个标准适用的相应区域。 有关如何满足这些标准的指南,请参阅 合规性。
合规标准 | 支持的区域 |
---|---|
PCI-DSS | 所有区域 |
HIPAA | 所有区域 |
HITRUST (健康信息信托联盟) | 所有区域 |
IRAP | australiacentral、australiacentral2、australiaeast、australiasoutheast |
CCCS 中等 | 加拿大中部、加拿大东部 |
UKCE+ | ukwest、uksouth |