Databricks 应用

Databricks 应用使开发人员能够直接在 Azure Databricks 平台上生成和部署安全数据和 AI 应用程序,无需单独的基础结构。 应用托管在 Azure Databricks 无服务器平台上,并与关键平台服务集成,其中包括:

  • 用于数据治理的 Unity Catalog
  • 用于查询数据的 Databricks SQL
  • 用于部署 AI 模型的模型服务
  • 适用于 ETL 和自动化的 Lakeflow 任务
  • 用于身份验证和授权的 OAuth 和服务主体

可以在本地开发应用,将其部署到工作区,并在工作区之间移动它们。 此托管模型无需开发人员处理安全性、基础结构和合规性,从而简化了将内部数据工具引入生产的过程。

Databricks 应用支持 Python 框架,如 Streamlit、Dash 和 Gradio。 有关在 Databricks 应用 UI 中使用常用 Python 框架的示例,请参阅 开发 Databricks 应用

有关 Databricks 应用定价的信息,请参阅“应用计算”。

常见用例

Databricks 应用适用于合并数据、AI 和自动化的内部工具。 示例用例包括:

  • 交互式数据可视化效果和嵌入式商业智能(BI)仪表板
  • 由 Genie 提供支持的 Retrieval-Augmented 代(RAG)聊天应用
  • Lakeflow 的自定义配置接口
  • Databricks SQL 支持的数据输入表单
  • 将多个 Azure Databricks 服务组合在一起的业务流程自动化
  • 自定义操作工具用于警报分类和响应

限制

  • 应用文件不能超过 10 MB。 如果应用目录中的任何文件超过此限制,部署将失败并出现错误。
  • Azure Databricks 在终止运行应用的计算资源时删除应用日志。 请参阅 您的 Databricks 应用日志
  • 如果通过 用户授权向应用授予许可,则以后无法撤销该同意。
  • 标准层工作区不支持 Databricks 应用。
  • 可以在 Azure Databricks 工作区中创建有限数量的应用。 有关详细信息,请参阅 资源限制。 有关免费版限制,请参阅 Databricks Free Edition 限制
  • 由于它们不支持 OAuth,因此不能对 Databricks Apps 使用 旧区域 URL

Databricks Apps 系统环境

注意

若要查看特定应用的环境(包括环境变量和已安装的包),请转到 应用详细信息页上的“环境 ”选项卡。 请参阅 查看 Databricks 应用的详细信息。

下面介绍了应用在其中运行的系统环境。 有关随应用预安装的 Python 包的列表,请参阅 Databricks 应用中的“定义环境变量”。

  • 操作系统:Ubuntu 22.04 LTS
  • Python 环境:Python 3.11.0,在专用虚拟环境中运行。 所有依赖项都在此环境中隔离,包括使用 requirements.txt 文件安装的库和预装库。
  • 系统资源:每个应用最多可以使用 2 个虚拟 CPU(vCPU)和 6 GB 内存。 如果应用超出这些限制,Azure Databricks 可能会重启它。

合规性标准支持

下表列出了 Databricks 应用支持的符合性标准以及每个标准适用的相应区域。 有关如何满足这些标准的指南,请参阅 合规性

合规标准 支持的区域
PCI-DSS 所有区域
HIPAA 所有区域
HITRUST (健康信息信托联盟) 所有区域
IRAP australiacentral、australiacentral2、australiaeast、australiasoutheast
CCCS 中等 加拿大中部、加拿大东部
UKCE+ ukwest、uksouth