Databricks Runtime ML 维护策略

Databricks Runtime ML 包括各种常用的 ML 和 DL 库。 这些库随着每个发行版进行更新,以包括新功能和修复。 本文介绍支持的顶层库、更新频率以及库弃用时的场景。

图书馆支持政策

Databricks 已将一部分受支持的库指定为顶层库。 对于这些库,Databricks 提供了更快的更新节奏,可通过每个运行时版本更新到最新的包版本(除非存在依赖项冲突)。 Databricks 还为顶层库提供高级支持、测试以及嵌入式优化。 顶级库只有在主要版本更新时才会添加或删除。

顶层库的完整列表为:

有关每个运行时版本中包含的所有库的列表,请参阅 Databricks Runtime ML 的 发行说明

库弃用策略

在以下情况下,Databricks 可能会从顶层列表中删除库:

  • 如果库在两个月内没有新提交,并且六个多月内没有新版本。 当活动维护恢复时,Databricks 可能会重新添加已删除的库。
  • 如果图书馆的使用显著下降。
  • 如果添加了新包来填补重大空缺,那么库将被替换。

当库达到以下任一条件时,Databricks 将删除预安装的库:

  • 不再主动维护该库。 当满足以下任一条件时,某个库被认为不再处于主动维护状态:
    • 三个月来没有新的提交,超过九个月来没有新的版本发布。
    • 图书馆的存储库已存档。
    • 已宣布停止该库的维护。
  • 找不到适用于新运行时的稳定版本。

计划删除库时,Databricks 会按照以下步骤通知客户:

  • 运行时发行说明中添加了弃用警告,指示将在下一个主要 Databricks Runtime ML 版本中删除该库。
  • 导入库时会显示一条通知,指示将在下一个主要 Databricks Runtime ML 版本中删除该库。
  • 引用库的 Databricks 文档已更新,以指示计划删除库。

若要在删除库后继续使用该库,可以手动安装该库或使用早期版本的 Databricks Runtime ML。