用于机器学习的 Databricks Runtime 15.1 (EoS)

注意

对此 Databricks Runtime 版本的支持已结束。 有关终止支持日期,请参阅终止支持历史记录。 有关所有受支持的 Databricks Runtime 版本,请参阅 Databricks Runtime 发行说明版本和兼容性

用于机器学习的 Databricks Runtime 15.1 基于 Databricks Runtime 15.1 (EoS) 为机器学习和数据科学提供随时可用的环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 Horovod 进行分布式深度学习训练。

提示

若要查看已终止支持 (EoS) 的 Databricks Runtime 版本的发行说明,请参阅终止支持 Databricks Runtime 发行说明。 EoS Databricks Runtime 版本已停用,可能不会更新。

新增功能和改进

Databricks Runtime 15.1 ML 基于 Databricks Runtime 15.1 构建。 若要了解 Databricks Runtime 15.1 中的新增功能,包括 Apache Spark MLlib 和 SparkR,请参阅 Databricks Runtime 15.1 (EoS) 发行说明。

中断性变更

默认情况下不再安装旧版 Databricks CLI

在 Databricks Runtime 14.3 LTS ML 及更低版本中,由于 MLflow 的预安装版本需要旧版 Databricks CLI,因此后者自动安装在 $PATH 中。 Databricks Runtime 15.1 ML 包括 MLflow 版本 2.10.2,它不需要旧版 CLI。

从 Databricks Runtime 15.1 ML 开始,旧版 Databricks CLI 不再自动安装在 $PATH 中。 对于依赖运行时中安装的旧版 CLI 的用户来说,这是一个中断性变更。 像 %sh databricks ... 这样的命令在 Databricks Runtime 15.1 ML 及更高版本中不再起作用。

若要继续从笔记本使用旧版 Databricks CLI,请将其安装为群集或笔记本库。 新的 Databricks CLI 可从 Web 终端获取。 有关详细信息,请参阅使用 Web 终端和 Databricks CLI

从 Databricks Runtime 15.1 ML 开始,MLeap 不再可用

MLeap 在 Databricks Runtime 15.1 ML 及更高版本中不再可用。 若要打包模型以方便部署到基于 JVM 的框架上,Databricks 建议使用 ONNX 格式

弃用 Horovod 和 HorovodRunner

Horovod 和 HorovodRunner 现已弃用。 对于分布式深度学习,Databricks 建议使用 TorchDistributor 通过 PyTorch 进行分布式训练,或使用 tf.distribute.Strategy API 通过 TensorFlow 进行分布式训练。 Horovod 和 HorovodRunner 预装在 Databricks Runtime 15.1 ML 中,但会在下一个主要的 Databricks Runtime ML 版本中删除。

注意

horovod.spark 不支持 pyarrow 版本 11.0 及更高版本(请参阅相关的 GitHub 问题)。 Databricks Runtime 15.1 ML 包括 pyarrow 版本 14.0.1。 若要将 horovod.spark 与 Databricks Runtime 15.1 ML 或更高版本配合使用,必须手动安装 pyarrow,并指定一个低于 11.0 的版本。

系统环境

Databricks Runtime 15.1 ML 中的系统环境在以下方面不同于 Databricks Runtime 15.1:

  • 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
    • CUDA 12.1
    • cuDNN 8.9.0.131-1
    • NCCL 2.17.1
    • TensorRT 8.6.1.6-1

图书馆

以下部分列出了 Databricks Runtime 15.1 ML 中包含的库,这些库不同于 Databricks Runtime 15.1 中包含的库。

本节内容:

顶层库

Databricks Runtime 15.1 ML 包含以下顶层

Python 库

Databricks Runtime 15.1 ML 使用 virtualenv 进行 Python 包管理,包含许多常用的 ML 包。

除了以下部分指定的包,Databricks Runtime 15.1 ML 还包含以下包:

  • hyperopt 0.2.7+db4
  • sparkdl 3.0.0_db1
  • automl 1.25.0

若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-15.1.txt 文件并运行 pip install -r requirements-15.1.txt。 此命令安装 Databricks Runtime ML 使用的所有开源库,但不安装 Databricks 开发的库,例如 databricks-automldatabricks-feature-store,或 hyperopt 的 Databricks 分支。

CPU 群集上的 Python 库

版本 版本 版本
ABSL-PY 系列 1.0.0 加速 0.25.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 异步-超时 4.0.2
属性 22.1.0 audioread 3.0.1 azure-core 1.30.1
azure-cosmos 4.3.1 azure-storage-blob 12.19.0 Azure存储文件数据湖 12.14.0
回调 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.12.2
黑色 23.3.0 漂白剂 4.1.0 有福 1.20.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 cachetools (缓存工具) 5.3.3 目录 2.0.10
类别编码器 2.6.3 certifi 2023.7.22 cffi 1.15.1
chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4 单击 8.0.4
cloudpathlib 0.16.0 cloudpickle 2.2.1 cmdstanpy 1.2.1
五彩缤纷 0.5.6 通讯 0.1.2 糖果 0.1.4
config解析器 5.2.0 contourpy 1.0.5 密码系统 41.0.3
骑行者 0.11.0 cymem 2.0.8 Cython 0.29.32
英安岩 1.8.1 databricks-automl-runtime 0.2.21 Databricks-特征工程 0.3.0
Databricks软件开发工具包 (databricks-sdk) 0.20.0 dataclasses-json 0.6.4 数据集 2.16.1
dbl-tempo 0.1.26 dbu-python 1.2.18 debugpy 1.6.7
装饰师 5.1.1 deepspeed 0.13.1 defusedxml 0.7.1
莳萝 0.3.6 磁盘缓存 5.6.3 distlib 0.3.8
dm-tree 0.1.8 入口点 0.4 评估 0.4.1
正在执行 0.8.3 各个方面概述 1.1.1 Farama-通知 0.0.4
fastjsonschema 2.19.1 fasttext 0.9.2 文件锁 (filelock) 3.9.0
烧瓶 2.2.5 FlatBuffers 23年5月26日 fonttools(字体工具) 4.25.0
frozenlist 1.3.3 fsspec 2023.5.0 未来 0.18.3
加斯特 0.4.0 gitdb (Git数据库) 4.0.11 GitPython 3.1.27
google-api-core 2.17.1 google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0
google-cloud-core (Google云核心) 2.4.1 谷歌云存储 (Google Cloud Storage) 2.11.0 google-crc32c 1.5.0
google-pasta 0.2.0 google-resumable-media(谷歌可恢复媒体) 2.7.0 googleapis-common-protos 1.62.0
gpustat 1.1.1 绿地 2.0.1 grpcio 1.60.0
grpcio-status 1.60.0 gunicorn 20.1.0 gviz-api 1.10.0
体育馆 0.28.1 h11 0.14.0 h5py 3.9.0
hjson 3.1.0 假期 0.38 horovod 0.28.1+db1
htmlmin 0.1.12 httpcore 1.0.4 httplib2 0.20.2
httpx 0.27.0 huggingface-hub(哈根脸社区平台) 0.20.2 IDNA 3.4
ImageHash 4.3.1 ImageIO 2.31.1 imbalanced-learn 0.11.0
importlib-metadata 6.0.0 importlib_resources 6.1.2 ipyflow-core 0.0.198
ipykernel 6.25.1 ipython 8.15.0 ipython-genutils(IPython通用工具) 0.2.0
ipywidgets 8.0.4 isodate 0.6.1 它很危险 2.0.1
Jax-Jumpy 1.0.0 jedi 0.18.1 吉普尼 0.7.1
Jinja2 3.1.2 jmespath 0.10.0 joblib 1.2.0
joblibspark 0.5.1 JSON补丁 1.33 jsonpointer 2.4
jsonschema 4.17.3 Jupyter 服务器 1.23.4 jupyter_client(Jupyter 客户端) 7.4.9
jupyter_core(Jupyter核心) 5.3.0 jupyterlab-pygments 0.1.2 jupyterlab-widgets 3.0.5
keras 2.15.0 钥匙圈 23.5.0 kiwisolver 1.4.4
langchain 0.1.3 Langchain社区 0.0.20 langchain-core 0.1.23
语言代码 3.3.0 langsmith 0.0.87 launchpadlib 1.10.16
lazr.restfulclient 0.14.4 lazr.uri 1.0.6 lazy_loader 0.2
libclang 16.0.6 librosa 0.10.1 lightgbm 4.2.0
LLVMlite 0.40.0 lxml 4.9.2 lz4 4.3.2
Mako 1.2.0 Markdown 3.4.1 markdown-it-py 2.2.0
MarkupSafe 2.1.1 棉花糖 3.21.1 matplotlib 3.7.2
matplotlib-inline 0.1.6 mdurl 0.1.0 mistune 0.8.4
ml-dtypes 0.2.0 mlflow-skinny 2.10.2 more-itertools 8.10.0
mpmath 1.3.0 msgpack 1.0.8 多重字典 6.0.2
多方法 1.11.2 多进程 0.70.14 murmurhash 1.0.10
mypy-extensions 0.4.3 nbclassic 0.5.5 nbclient 0.5.13
nbconvert 6.5.4 nbformat 5.7.0 nest-asyncio 1.5.6
NetworkX 3.1 忍者 1.11.1.1 nltk 3.8.1
笔记本 6.5.4 notebook_shim 0.2.2 麻木 0.57.1
numpy 1.23.5 nvidia-ml-py 12.535.133 oauthlib 3.2.0
openai 1.9.0 opencensus 0.11.4 opencensus-context 0.1.3
opt-einsum 3.3.0 打包 23.2 熊猫 1.5.3
pandocfilters 1.5.0 paramiko 2.9.2 帕尔索 0.8.3
pathspec 0.10.3 替罪羊 0.5.3 petastorm 0.12.1
pexpect 4.8.0 phik 0.12.4 pickleshare 0.7.5
枕头 9.4.0 果仁 23.2.1 platformdirs 3.10.0
plotly 5.9.0 pmdarima 2.0.4 狗狗 1.8.1
preshed 3.0.9 prometheus-client 0.14.1 prompt-toolkit 3.0.36
先知 1.1.5 protobuf 4.24.1 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo 8.0.0 py-spy 0.3.14 pyarrow 14.0.1
pyarrow-hotfix 0.6 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.11.1 pyccolo 0.0.52 Python代码解析器 2.21
pydantic 1.10.6 Pygments 2.15.1 PyGObject 3.42.1
PyJWT 2.3.0 PyNaCl 1.5.0 pynvml 11.5.0
pyodbc 4.0.38 pyparsing 3.0.9 pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0
pytesseract 0.3.10 python-dateutil 2.8.2 Python代码编辑器 1.0.4
python-lsp-jsonrpc 1.1.1 pytz 2022年7月 PyWavelets 1.4.1
PyYAML 6.0 pyzmq 23.2.0 射线 2.9.3
正则表达式 2022.7.9 请求 2.31.0 requests-oauthlib 1.3.1
回应 0.13.3 13.7.1 rsa 4.9
s3transfer 0.10.0 safetensors 0.3.2 scikit-image 0.20.0
scikit-learn 1.3.0 scipy 1.11.1 seaborn 0.12.2
SecretStorage 3.3.1 Send2Trash 1.8.0 sentence-transformers (句子转换器) 2.2.2
sentencepiece 0.1.99 setuptools 68.0.0 沙普 0.44.0
simplejson 3.17.6 6 1.16.0 切片机 0.0.7
smart-open 5.2.1 smmap 5.0.0 思尼菲欧 1.2.0
音频文件 0.12.1 汤滤器 2.4 soxr 0.3.7
spacy 3.7.2 spacy-legacy 3.0.12 spacy-loggers 1.0.5
spark-tensorflow-distributor 1.0.0 SQLAlchemy 1.4.39 sqlparse 0.4.2
srsly 2.4.8 ssh-import-id 5.11 堆栈数据 0.2.0
斯塔尼奥 0.3.0 statsmodels 0.14.0 sympy 1.11.1
tangled -up-in-unicode 0.2.0 毅力 8.2.2 TensorBoard 2.15.1
TensorBoard数据服务器 0.7.2 tensorboard-profile插件 2.15.0 tensorboardX 2.6.2.2
tensorflow-cpu 2.15.0 tensorflow-estimator 2.15.0 tensorflow-io-gcs-filesystem 0.36.0
termcolor 2.4.0 完成 0.17.1 thinc 8.2.3
threadpoolctl 2.2.0 tifffile 2021年7月2日 tiktoken 0.5.2
tinycss2 1.2.1 tokenize-rt 4.2.1 分词器 0.15.0
火炬 2.1.2+cpu torcheval 0.0.7 torchvision 0.16.2+cpu
龙卷风 6.3.2 tqdm 4.65.0 Traitlets 5.7.1
变压器 4.36.2 typeguard 2.13.3 打字员 0.9.0
输入检查 0.9.0 typing_extensions 4.7.1 tzdata 2022年1月
ujson 5.4.0 无人参与升级 0.1 urllib3 1.26.16
virtualenv 20.21.0 愿景 0.7.5 wadllib 1.3.6
山葵 1.1.2 wcwidth 0.2.5 黄鼠狼 0.3.4
Web编码 0.5.1 WebSocket客户端 0.58.0 Werkzeug 2.2.3
轮子 0.38.4 widgetsnbextension 4.0.5 wordcloud 1.9.3
裹住 1.14.1 XGBoost 2.0.3 xxhash 3.4.1
雅尔 1.8.1 ydata-profiling 4.5.1 齐普 3.11.0

GPU 群集上的 Python 库

版本 版本 版本
ABSL-PY 系列 1.0.0 加速 0.25.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 异步-超时 4.0.2
属性 22.1.0 audioread 3.0.1 azure-core 1.30.1
azure-cosmos 4.3.1 azure-storage-blob 12.19.0 Azure存储文件数据湖 12.14.0
回调 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.12.2
黑色 23.3.0 漂白剂 4.1.0 有福 1.20.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 cachetools (缓存工具) 5.3.3 目录 2.0.10
类别编码器 2.6.3 certifi 2023.7.22 cffi 1.15.1
chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4 单击 8.0.4
cloudpathlib 0.16.0 cloudpickle 2.2.1 cmdstanpy 1.2.1
五彩缤纷 0.5.6 通讯 0.1.2 糖果 0.1.4
config解析器 5.2.0 contourpy 1.0.5 密码系统 41.0.3
骑行者 0.11.0 cymem 2.0.8 Cython 0.29.32
英安岩 1.8.1 databricks-automl-runtime 0.2.21 Databricks-特征工程 0.3.0
Databricks软件开发工具包 (databricks-sdk) 0.20.0 dataclasses-json 0.6.4 数据集 2.16.1
dbl-tempo 0.1.26 dbu-python 1.2.18 debugpy 1.6.7
装饰师 5.1.1 deepspeed 0.13.1 defusedxml 0.7.1
莳萝 0.3.6 磁盘缓存 5.6.3 distlib 0.3.8
dm-tree 0.1.8 einops 0.7.0 入口点 0.4
评估 0.4.1 正在执行 0.8.3 各个方面概述 1.1.1
Farama-通知 0.0.4 fastjsonschema 2.19.1 fasttext 0.9.2
文件锁 (filelock) 3.9.0 flash-attn 2.5.0 烧瓶 2.2.5
FlatBuffers 23年5月26日 fonttools(字体工具) 4.25.0 frozenlist 1.3.3
fsspec 2023.5.0 未来 0.18.3 加斯特 0.4.0
gitdb (Git数据库) 4.0.11 GitPython 3.1.27 google-api-core 2.17.1
google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0 google-cloud-core (Google云核心) 2.4.1
谷歌云存储 (Google Cloud Storage) 2.11.0 google-crc32c 1.5.0 google-pasta 0.2.0
google-resumable-media(谷歌可恢复媒体) 2.7.0 googleapis-common-protos 1.62.0 gpustat 1.1.1
绿地 2.0.1 grpcio 1.60.0 grpcio-status 1.60.0
gunicorn 20.1.0 gviz-api 1.10.0 体育馆 0.28.1
h11 0.14.0 h5py 3.9.0 hjson 3.1.0
假期 0.38 horovod 0.28.1+db1 htmlmin 0.1.12
httpcore 1.0.4 httplib2 0.20.2 httpx 0.27.0
huggingface-hub(哈根脸社区平台) 0.20.2 IDNA 3.4 ImageHash 4.3.1
ImageIO 2.31.1 imbalanced-learn 0.11.0 importlib-metadata 6.0.0
importlib_resources 6.1.2 ipyflow-core 0.0.198 ipykernel 6.25.1
ipython 8.15.0 ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 8.0.4
isodate 0.6.1 它很危险 2.0.1 Jax-Jumpy 1.0.0
jedi 0.18.1 吉普尼 0.7.1 Jinja2 3.1.2
jmespath 0.10.0 joblib 1.2.0 joblibspark 0.5.1
JSON补丁 1.33 jsonpointer 2.4 jsonschema 4.17.3
Jupyter 服务器 1.23.4 jupyter_client(Jupyter 客户端) 7.4.9 jupyter_core(Jupyter核心) 5.3.0
jupyterlab-pygments 0.1.2 jupyterlab-widgets 3.0.5 keras 2.15.0
钥匙圈 23.5.0 kiwisolver 1.4.4 langchain 0.1.3
Langchain社区 0.0.20 langchain-core 0.1.23 语言代码 3.3.0
langsmith 0.0.87 launchpadlib 1.10.16 lazr.restfulclient 0.14.4
lazr.uri 1.0.6 lazy_loader 0.2 libclang 16.0.6
librosa 0.10.1 lightgbm 4.2.0 LLVMlite 0.40.0
lxml 4.9.2 lz4 4.3.2 Mako 1.2.0
Markdown 3.4.1 markdown-it-py 2.2.0 MarkupSafe 2.1.1
棉花糖 3.21.1 matplotlib 3.7.2 matplotlib-inline 0.1.6
mdurl 0.1.0 mistune 0.8.4 ml-dtypes 0.2.0
mlflow-skinny 2.10.2 more-itertools 8.10.0 mpmath 1.3.0
msgpack 1.0.8 多重字典 6.0.2 多方法 1.11.2
多进程 0.70.14 murmurhash 1.0.10 mypy-extensions 0.4.3
nbclassic 0.5.5 nbclient 0.5.13 nbconvert 6.5.4
nbformat 5.7.0 nest-asyncio 1.5.6 NetworkX 3.1
忍者 1.11.1.1 nltk 3.8.1 笔记本 6.5.4
notebook_shim 0.2.2 麻木 0.57.1 numpy 1.23.5
nvidia-ml-py 12.535.133 oauthlib 3.2.0 openai 1.9.0
opencensus 0.11.4 opencensus-context 0.1.3 opt-einsum 3.3.0
打包 23.2 熊猫 1.5.3 pandocfilters 1.5.0
paramiko 2.9.2 帕尔索 0.8.3 pathspec 0.10.3
替罪羊 0.5.3 petastorm 0.12.1 pexpect 4.8.0
phik 0.12.4 pickleshare 0.7.5 枕头 9.4.0
果仁 23.2.1 platformdirs 3.10.0 plotly 5.9.0
pmdarima 2.0.4 狗狗 1.8.1 preshed 3.0.9
prompt-toolkit 3.0.36 先知 1.1.5 protobuf 4.24.1
psutil 5.9.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 py-cpuinfo 8.0.0 py-spy 0.3.14
pyarrow 14.0.1 pyarrow-hotfix 0.6 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.11.1 pyccolo 0.0.52
Python代码解析器 2.21 pydantic 1.10.6 Pygments 2.15.1
PyGObject 3.42.1 PyJWT 2.3.0 PyNaCl 1.5.0
pynvml 11.5.0 pyodbc 4.0.38 pyparsing 3.0.9
pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0 pytesseract 0.3.10 python-dateutil 2.8.2
Python代码编辑器 1.0.4 python-lsp-jsonrpc 1.1.1 pytz 2022年7月
PyWavelets 1.4.1 PyYAML 6.0 pyzmq 23.2.0
射线 2.9.3 正则表达式 2022.7.9 请求 2.31.0
requests-oauthlib 1.3.1 回应 0.13.3 13.7.1
rsa 4.9 s3transfer 0.10.0 safetensors 0.3.2
scikit-image 0.20.0 scikit-learn 1.3.0 scipy 1.11.1
seaborn 0.12.2 SecretStorage 3.3.1 Send2Trash 1.8.0
sentence-transformers (句子转换器) 2.2.2 sentencepiece 0.1.99 setuptools 68.0.0
沙普 0.44.0 simplejson 3.17.6 6 1.16.0
切片机 0.0.7 smart-open 5.2.1 smmap 5.0.0
思尼菲欧 1.2.0 音频文件 0.12.1 汤滤器 2.4
soxr 0.3.7 spacy 3.7.2 spacy-legacy 3.0.12
spacy-loggers 1.0.5 spark-tensorflow-distributor 1.0.0 SQLAlchemy 1.4.39
sqlparse 0.4.2 srsly 2.4.8 ssh-import-id 5.11
堆栈数据 0.2.0 斯塔尼奥 0.3.0 statsmodels 0.14.0
sympy 1.11.1 tangled -up-in-unicode 0.2.0 毅力 8.2.2
TensorBoard 2.15.1 TensorBoard数据服务器 0.7.2 tensorboard-profile插件 2.15.0
tensorboardX 2.6.2.2 TensorFlow 2.15.0 tensorflow-estimator 2.15.0
tensorflow-io-gcs-filesystem 0.36.0 termcolor 2.4.0 完成 0.17.1
thinc 8.2.3 threadpoolctl 2.2.0 tifffile 2021年7月2日
tiktoken 0.5.2 tinycss2 1.2.1 tokenize-rt 4.2.1
分词器 0.15.0 火炬 2.1.2+cu121 torcheval 0.0.7
torchvision 0.16.2+cu121 龙卷风 6.3.2 tqdm 4.65.0
Traitlets 5.7.1 变压器 4.36.2 氚核 2.1.0
typeguard 2.13.3 打字员 0.9.0 输入检查 0.9.0
typing_extensions 4.7.1 tzdata 2022年1月 ujson 5.4.0
无人参与升级 0.1 urllib3 1.26.16 virtualenv 20.21.0
愿景 0.7.5 wadllib 1.3.6 山葵 1.1.2
wcwidth 0.2.5 黄鼠狼 0.3.4 Web编码 0.5.1
WebSocket客户端 0.58.0 Werkzeug 2.2.3 轮子 0.38.4
widgetsnbextension 4.0.5 wordcloud 1.9.3 裹住 1.14.1
XGBoost 2.0.3 xxhash 3.4.1 雅尔 1.8.1
ydata-profiling 4.5.1 齐普 3.11.0

R 库

R 库与 Databricks Runtime 15.1 中的 R 库完全相同。

Java 库和 Scala 库(Scala 2.12 群集)

除了 Databricks Runtime 15.1 中的 Java 库和 Scala 库之外,Databricks Runtime 15.1 ML 还包含以下 JAR:

CPU 群集

组 ID 项目 ID 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.10.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0

GPU 群集

组 ID 项目 ID 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.10.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0