用于机器学习的 Databricks Runtime 16.4 LTS

Databricks Runtime 16.4 LTS for Machine Learning 提供了基于 Databricks Runtime 16.4 LTS 的机器学习和数据科学的就绪to-go 环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 TorchDistributor、DeepSpeed 和 Ray 进行分布式深度学习训练。

小窍门

若要查看已终止支持 (EoS) 的 Databricks Runtime 版本的发行说明,请参阅终止支持 Databricks Runtime 发行说明。 EoS Databricks Runtime 版本已停用,可能不会更新。

新功能和改进

Databricks Runtime 16.4 LTS ML 基于 Databricks Runtime 16.4 LTS 构建。 有关 Databricks Runtime 16.4 LTS(包括 Apache Spark MLlib 和 SparkR)中的新增功能的信息,请参阅 Databricks Runtime 16.4 LTS 发行说明。

其他更改

XGBoost4J-Spark 现已弃用

XGBoost4J-Spark 现已弃用,不会在下一个主要 Databricks Runtime ML 版本中预安装。 Databricks 建议将 Python API 用于 xgboost.spark. 请参阅针对 XGBoost 模型的分布式训练xgboost.spark

系统环境

Databricks Runtime 16.4 LTS ML 中的系统环境不同于 Databricks Runtime 16.4 LTS,如下所示。

  • 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
    • CUDA 12.6
    • cublas 12.6.0.22-1
    • cusolver 11.6.4.38-1
    • cupti 12.6.37-1
    • cusparse 12.5.2.23-1
    • cuDNN 9.3.0.75-1
    • NCCL 2.22.3
    • TensorRT 10.2.0.19-1

图书馆

以下部分列出了 Databricks Runtime 16.4 LTS ML 中包含的库,这些库不同于 Databricks Runtime 16.4 LTS 中包含的库。

本节内容:

顶级图书馆

Databricks Runtime 16.4 LTS ML 包含以下顶层

Python 库

Databricks Runtime 16.4 LTS ML 用于 virtualenv Python 包管理,并包括许多常用的 ML 包。

除了以下部分中指定的包外,Databricks Runtime 16.4 LTS ML 还包括以下包:

  • hyperopt 0.2.8+db1
  • automl 1.30.0

若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-16.4.txt 文件并运行 pip install -r requirements-16.4.txt。 此命令安装 Databricks Runtime ML 使用的所有开源库,但不安装 Databricks 开发的库,例如 databricks-automl 或 Databricks 分支的 hyperopt

CPU 群集上的 Python 库

图书馆 版本 图书馆 版本 图书馆 版本
ABSL-PY 系列 1.0.0 加速 1.5.2 aiohttp 3.9.5
aiohttp-cors 0.8.1 aiosignal 1.2.0 alembic 1.14.1
批注类型 0.7.0 anyio 4.2.0 argcomplete 3.6.2
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 箭头 1.2.3
阿斯托尔 0.8.1 asttokens 2.0.5 astunparse 1.6.3
async-lru 2.0.4 属性 23.1.0 audioread 3.0.1
自动命令 2.2.2 azure-core 1.33.0 azure-cosmos 4.3.1
Azure 身份识别 1.21.0 azure-storage-blob 12.23.0 Azure存储文件数据湖 12.17.0
巴别塔 2.11.0 退避 2.2.1 backports.tarfile 1.2.0
bcrypt 3.2.0 beautifulsoup4 4.12.3 黑色 24.4.2
漂白剂 4.1.0 闪烁器 1.7.0 布利斯 0.7.11
boto3 1.34.69 botocore 1.34.69 Brotli 1.0.9
cachetools (缓存工具) 5.3.3 目录 2.0.10 类别编码器 2.6.3
certifi 2024年6月2日 cffi 1.16.0 chardet 4.0.0
charset-normalizer (字符集正常化工具) 2.0.4 断路器 2.1.3 点击 8.1.7
cloudpathlib 0.21.0 cloudpickle 2.2.1 cmdstanpy 1.2.5
丰富多彩 0.5.6 colorlog 6.9.0 通讯 0.2.1
作曲家 0.29.0 糖果 0.1.5 config解析器 5.2.0
contourpy 1.2.0 coolname 2.2.0 密码学 42.0.5
骑行者 0.11.0 cymem 2.0.11 Cython 3.0.11
英安岩 1.9.2 databricks-automl-runtime 0.2.21 Databricks-特征工程 0.10.2
Databricks软件开发工具包 (databricks-sdk) 0.30.0 数据集 3.5.0 dbl-tempo 0.1.26
dbus-python 1.3.2 debugpy 1.6.7 装饰师 5.1.1
deepspeed 0.16.5 defusedxml 0.7.1 已弃用 1.2.18
莳萝 0.3.8 distlib 0.3.8 dm-tree 0.1.9
从文档字符串到Markdown 0.11 einops 0.8.1 入口点 0.4
评价 0.4.3 正在执行 0.8.3 各个方面概述 1.1.1
Farama-通知 0.0.4 fastapi 0.115.12 fastjsonschema 2.21.1
fasttext-wheel 0.9.2 文件锁 (filelock) 3.13.1 烧瓶 2.2.5
FlatBuffers 25.2.10 fonttools(字体工具) 4.51.0 FQDN 1.5.1
frozenlist 1.4.0 fsspec 2023.5.0 未来 0.18.3
加斯特 0.4.0 gitdb (Git数据库) 4.0.11 GitPython 3.1.37
google-api-core 2.20.0 google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.2.1
google-cloud-core (Google云核心) 2.4.3 谷歌云存储 (Google Cloud Storage) 2.10.0 google-crc32c 1.7.1
google-pasta 0.2.0 google-resumable-media(谷歌可恢复媒体) 2.7.2 googleapis-common-protos 1.70.0
gql 3.5.2 graphql-core 3.2.4 绿地 3.0.1
grpcio 1.60.0 grpcio-status 1.60.0 gunicorn 20.1.0
gviz-api 1.10.0 体育馆 0.28.1 h11 0.14.0
h5py 3.11.0 hjson 3.1.0 假期 0.54
htmlmin 0.1.12 httpcore 1.0.8 httplib2 0.20.4
httpx 0.28.1 huggingface-hub(哈根脸社区平台) 0.29.3 IDNA 3.7
ImageHash 4.3.1 ImageIO 2.33.1 imbalanced-learn 0.12.3
importlib-metadata 6.0.0 importlib_resources 6.5.2 屈折 7.3.1
ipyflow-core 0.0.201 ipykernel 6.28.0 ipython 8.25.0
ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 7.7.2 isodate 0.6.1
isoduration 20.11.0 它很危险 2.2.0 jaraco.context 5.3.0
jaraco.functools 4.0.1 jaraco.text 3.12.1 Jax-Jumpy 1.0.0
jedi 0.19.1 Jinja2 3.1.4 抖动 0.9.0
jmespath 1.0.1 joblib 1.4.2 joblibspark 0.5.3
json5 0.9.6 JSON补丁 1.33 jsonpointer 3.0.0
jsonschema 4.19.2 JSON模式规范 2023年7月1日 jupyter-events(Jupyter 事件) 0.10.0
jupyter-lsp 2.2.0 jupyter_client(Jupyter 客户端) 8.6.0 jupyter_core(Jupyter核心) 5.7.2
Jupyter服务器 2.14.1 Jupyter服务器终端 0.4.4 jupyterlab 4.0.11
jupyterlab-pygments 0.1.2 jupyterlab_server (JupyterLab 服务器) 2.25.1 keras 3.9.0
kiwisolver 1.4.4 langchain 0.3.21 langchain-core 0.3.51
langchain-文本分割器 0.3.8 语言代码 3.5.0 langsmith 0.1.133
语言数据 1.3.0 launchpadlib 1.11.0 lazr.restfulclient 0.14.6
lazr.uri 1.0.6 lazy_loader 0.4 libclang 15.0.6.1
librosa 0.10.2 lightgbm 4.5.0 闪电工具 0.14.3
linkify -it-py 2.0.0 LLVMlite 0.42.0 lz4 4.3.2
Mako 1.2.0 marisa-trie 1.2.0 Markdown 3.4.1
markdown-it-py 2.2.0 MarkupSafe 2.1.3 matplotlib 3.8.4
matplotlib-inline 0.1.6 麦卡贝 0.7.0 mdit-py-plugins 0.3.0
mdurl 0.1.0 memray 1.17.1 mistune 2.0.4
ml-dtypes 0.4.1 mlflow-skinny 2.21.3 more-itertools 10.3.0
mosaicml-cli 0.6.41 mosaicml-streaming 0.11.0 mpmath 1.3.0
MSAL 1.32.0 msal-extensions 1.3.1 msgpack 1.1.0
多重字典 6.0.4 多方法 1.12 多进程 0.70.16
murmurhash 1.0.12 mypy 1.10.0 mypy-extensions 1.0.0
namex 0.0.8 nbclient 0.8.0 nbconvert 7.10.0
nbformat 5.9.2 nest-asyncio 1.6.0 NetworkX 3.2.1
忍者 1.11.1.1 nltk 3.8.1 nodeenv 1.9.1
笔记本 7.0.8 notebook_shim 0.2.3 麻木 0.59.1
numpy 1.26.4 oauthlib 3.2.0 oci 2.150.0
openai 1.69.0 opencensus 0.11.4 opencensus-context 0.1.3
OpenTelemetry API 1.32.0 opentelemetry-sdk(开源遥测软件开发工具包) 1.32.0 opentelemetry-semantic-conventions 0.53b0
opt_einsum 3.4.0 optree 0.15.0 optuna 3.6.1
optuna集成 3.6.0 orjson 3.10.16 重写 7.4.0
包装 24.1 熊猫 1.5.3 pandocfilters 1.5.0
paramiko 3.4.0 帕尔索 0.8.3 pathspec 0.10.3
替罪羊 0.5.6 pexpect 4.8.0 Φ系数 0.12.4
枕头 10.3.0 果仁 24.2 platformdirs 3.10.0
plotly 5.22.0 Pluggy (Python库) 1.0.0 pmdarima 2.0.4
狗狗 1.8.2 preshed 3.0.9 prometheus-client 0.14.1
prompt-toolkit 3.0.43 先知 1.1.6 proto-plus 1.26.1
protobuf 4.24.1 psutil 5.9.0 psycopg2 2.9.3
ptyprocess 0.7.0 pure-eval 0.2.2 py-cpuinfo 9.0.0
py-spy(Python程序性能分析工具) 0.4.0 pyarrow 15.0.2 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.13.6 pyccolo 0.0.65
Python代码解析器 2.21 pydantic 2.8.2 pydantic_core 2.20.1
pyflakes 3.2.0 Pygments 2.15.1 PyGObject 3.48.2
PyJWT 2.7.0 PyNaCl 1.5.0 pyodbc 5.0.1
pyOpenSSL 24.0.0 pyparsing 3.0.9 pyright 1.1.294
pytesseract 0.3.10 python-dateutil 2.9.0.post0 Python代码编辑器 1.0.4
python-json-logger 2.0.7 python-lsp-jsonrpc 1.1.2 python-lsp-server 1.10.0
python-snappy 0.6.1 pytoolconfig 1.2.6 pytorch-ranger(PyTorch优化器库) 0.1.1
pytz 2024.1 PyWavelets 1.5.0 PyYAML 6.0.1
pyzmq 25.1.2 问卷 2.1.0 射线 2.37.0
引用 0.30.2 正则表达式 2023年10月3日 请求 2.32.2
requests-oauthlib 1.3.1 requests-toolbelt 1.0.0 rfc3339-validator 0.1.4
rfc3986验证器 0.1.1 13.3.5 绳子 1.12.0
rpds-py 0.10.6 rsa 4.9 ruamel.yaml 0.18.10
ruamel.yaml.clib 0.2.12 s3transfer 0.10.2 safetensors 0.4.4
scikit-image 0.23.2 scikit-learn 1.4.2 scipy 1.13.1
seaborn 0.13.2 Send2Trash 1.8.2 sentence-transformers (句子转换器) 3.4.1
sentencepiece 0.2.0 setuptools 74.0.0 沙普 0.46.0
谢灵汉姆 1.5.4 simplejson 3.17.6 6 1.16.0
切片机 0.0.8 smart-open 5.2.1 smmap 5.0.0
思尼菲欧 1.3.0 音频文件 0.12.1 汤滤器 2.5
soxr 0.5.0.post1 spacy 3.7.5 spacy-legacy 3.0.12
spacy-loggers 1.0.5 SQLAlchemy 2.0.30 sqlparse 0.4.2
srsly 2.5.1 ssh-import-id 5.11 堆栈数据 0.2.0
斯塔尼奥 0.5.1 starlette 0.46.2 statsmodels 0.14.2
sympy 1.13.1 制表 0.9.0 tangled -up-in-unicode 0.2.0
毅力 8.2.2 TensorBoard 2.17.0 TensorBoard数据服务器 0.7.2
tensorboard-profile插件 2.17.0 tensorboardX 2.6.2.2 TensorFlow 2.17.0
tensorflow-estimator 2.15.0 termcolor 3.0.1 完成 0.17.1
文本 3.1.0 tf_keras 2.17.0 thinc 8.2.5
threadpoolctl 2.2.0 tifffile 2023.4.12 tiktoken 0.7.0
tinycss2 1.2.1 tokenize-rt 4.2.1 分词器 0.21.0
tomli 2.0.1 火炬 2.6.0+cpu torch优化器 0.3.0
torcheval 0.0.7 torchmetrics 1.6.0 炬视讯 0.21.0+cpu
龙卷风 6.4.1 tqdm 4.66.4 Traitlets 5.14.3
变压器 4.50.2 typeguard 4.4.2 打字员 0.15.2
types-protobuf 3.20.3 types-psutil 5.9.0 types-pytz 2023.3.1.1
types-PyYAML 6.0.0 请求类型 2.31.0.0 types-setuptools(类型-安装工具包) 68.0.0.0
类型六 1.16.0 types-urllib3 1.26.25.14 输入扩展 (typing_extensions) 4.11.0
uc-micro-py 1.0.1 ujson 5.10.0 无人参与升级 0.1
URI 模板 1.3.0 urllib3 1.26.16 uvicorn 0.34.1
验证者 0.34.0 virtualenv 20.26.2 愿景 0.7.5
wadllib 1.3.6 山葵 1.1.3 wcwidth 0.2.5
黄鼠狼 0.4.1 webcolors 24.11.1 Web编码 0.5.1
WebSocket客户端 1.8.0 WebSockets 11.0.3 Werkzeug 3.0.3
whatthepatch 1.0.2 轮子 0.43.0 wordcloud 1.9.4
裹住 1.14.1 XGBoost 2.0.3 xgboost-ray 0.1.19
xxhash 3.4.1 yapf 0.33.0 雅尔 1.9.3
ydata-profiling 4.9.0 齐普 3.17.0 zstd 1.5.5.1

GPU 群集上的 Python 库

注释

PyTorch 使用 CUDA PyPI 依赖项来提供 CUDA 支持,而不是使用 Databricks Runtime 16.4 LTS ML 中内置的 CUDA 库版本。

图书馆 版本 图书馆 版本 图书馆 版本
ABSL-PY 系列 1.0.0 加速 1.5.2 aiohttp 3.9.5
aiohttp-cors 0.8.1 aiosignal 1.2.0 批注类型 0.7.0
anyio 4.2.0 argcomplete 3.6.2 argon2-cffi 21.3.0
argon2-cffi-bindings 21.2.0 箭头 1.2.3 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 async-lru 2.0.4
属性 23.1.0 audioread 3.0.1 自动命令 2.2.2
azure-core 1.33.0 azure-cosmos 4.3.1 Azure 身份识别 1.21.0
azure-storage-blob 12.23.0 Azure存储文件数据湖 12.17.0 巴别塔 2.11.0
退避 2.2.1 backports.tarfile 1.2.0 bcrypt 3.2.0
beautifulsoup4 4.12.3 黑色 24.4.2 漂白剂 4.1.0
闪烁器 1.7.0 布利斯 0.7.11 boto3 1.34.69
botocore 1.34.69 Brotli 1.0.9 cachetools (缓存工具) 5.3.3
目录 2.0.10 类别编码器 2.6.3 certifi 2024年6月2日
cffi 1.16.0 chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4
断路器 2.1.3 点击 8.1.7 cloudpathlib 0.21.0
cloudpickle 2.2.1 cmdstanpy 1.2.5 丰富多彩 0.5.6
colorlog 6.9.0 通讯 0.2.1 作曲家 0.29.0
糖果 0.1.5 config解析器 5.2.0 contourpy 1.2.0
coolname 2.2.0 密码学 42.0.5 骑行者 0.11.0
cymem 2.0.11 Cython 3.0.11 英安岩 1.9.2
databricks-automl-runtime 0.2.21 Databricks-特征工程 0.10.2 Databricks软件开发工具包 (databricks-sdk) 0.30.0
数据集 3.5.0 dbl-tempo 0.1.26 dbus-python 1.3.2
debugpy 1.6.7 装饰师 5.1.1 deepspeed 0.16.5
defusedxml 0.7.1 已弃用 1.2.18 莳萝 0.3.8
distlib 0.3.8 dm-tree 0.1.9 从文档字符串到Markdown 0.11
einops 0.8.1 入口点 0.4 评价 0.4.3
正在执行 0.8.3 各个方面概述 1.1.1 Farama-通知 0.0.4
fastapi 0.115.12 fastjsonschema 2.21.1 fasttext-wheel 0.9.2
文件锁 (filelock) 3.13.1 flash_attn 2.7.4.post1 烧瓶 2.2.5
FlatBuffers 25.2.10 fonttools(字体工具) 4.51.0 FQDN 1.5.1
frozenlist 1.4.0 fsspec 2023.5.0 未来 0.18.3
加斯特 0.4.0 gitdb (Git数据库) 4.0.11 GitPython 3.1.37
google-api-core 2.20.0 google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.2.1
google-cloud-core (Google云核心) 2.4.3 谷歌云存储 (Google Cloud Storage) 2.10.0 google-crc32c 1.7.1
google-pasta 0.2.0 google-resumable-media(谷歌可恢复媒体) 2.7.2 googleapis-common-protos 1.70.0
gql 3.5.2 graphql-core 3.2.4 绿地 3.0.1
grpcio 1.60.0 grpcio-status 1.60.0 gunicorn 20.1.0
gviz-api 1.10.0 体育馆 0.28.1 h11 0.14.0
h5py 3.11.0 hjson 3.1.0 假期 0.54
htmlmin 0.1.12 httpcore 1.0.8 httplib2 0.20.4
httpx 0.28.1 huggingface-hub(哈根脸社区平台) 0.29.3 IDNA 3.7
ImageHash 4.3.1 ImageIO 2.33.1 imbalanced-learn 0.12.3
importlib-metadata 6.0.0 importlib_resources 6.5.2 屈折 7.3.1
ipyflow-core 0.0.201 ipykernel 6.28.0 ipython 8.25.0
ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 7.7.2 isodate 0.6.1
isoduration 20.11.0 它很危险 2.2.0 jaraco.context 5.3.0
jaraco.functools 4.0.1 jaraco.text 3.12.1 Jax-Jumpy 1.0.0
jedi 0.19.1 Jinja2 3.1.4 抖动 0.9.0
jmespath 1.0.1 joblib 1.4.2 joblibspark 0.5.3
json5 0.9.6 JSON补丁 1.33 jsonpointer 3.0.0
jsonschema 4.19.2 JSON模式规范 2023年7月1日 jupyter-events(Jupyter 事件) 0.10.0
jupyter-lsp 2.2.0 jupyter_client(Jupyter 客户端) 8.6.0 jupyter_core(Jupyter核心) 5.7.2
Jupyter服务器 2.14.1 Jupyter服务器终端 0.4.4 jupyterlab 4.0.11
jupyterlab-pygments 0.1.2 jupyterlab_server (JupyterLab 服务器) 2.25.1 keras 3.9.0
kiwisolver 1.4.4 langchain 0.3.21 langchain-core 0.3.51
langchain-文本分割器 0.3.8 语言代码 3.5.0 langsmith 0.1.133
语言数据 1.3.0 launchpadlib 1.11.0 lazr.restfulclient 0.14.6
lazr.uri 1.0.6 lazy_loader 0.4 libclang 15.0.6.1
librosa 0.10.2 lightgbm 4.5.0 闪电工具 0.14.3
linkify -it-py 2.0.0 LLVMlite 0.42.0 lz4 4.3.2
Mako 1.2.0 marisa-trie 1.2.0 Markdown 3.4.1
markdown-it-py 2.2.0 MarkupSafe 2.1.3 matplotlib 3.8.4
matplotlib-inline 0.1.6 麦卡贝 0.7.0 mdit-py-plugins 0.3.0
mdurl 0.1.0 memray 1.17.1 mistune 2.0.4
ml-dtypes 0.4.1 mlflow-skinny 2.21.3 more-itertools 10.3.0
mosaicml-cli 0.6.41 mosaicml-streaming 0.11.0 mpmath 1.3.0
MSAL 1.32.0 msal-extensions 1.3.1 msgpack 1.1.0
多重字典 6.0.4 多方法 1.12 多进程 0.70.16
murmurhash 1.0.12 mypy 1.10.0 mypy-extensions 1.0.0
namex 0.0.8 nbclient 0.8.0 nbconvert 7.10.0
nbformat 5.9.2 nest-asyncio 1.6.0 NetworkX 3.2.1
忍者 1.11.1.1 nltk 3.8.1 nodeenv 1.9.1
笔记本 7.0.8 notebook_shim 0.2.3 麻木 0.59.1
numpy 1.26.4 nvidia-cublas-cu12 12.4.5.8 nvidia-cuda-cupti-cu12 12.4.127
nvidia-cuda-nvrtc-cu12 12.4.127 nvidia-cuda-runtime-cu12 12.4.127 nvidia-cudnn-cu12 9.1.0.70
nvidia-cufft-cu12 11.2.1.3 nvidia-curand-cu12 10.3.5.147 nvidia-cusolver-cu12 11.6.1.9
nvidia-cusparse-cu12 12.3.1.170 nvidia-cusparselt-cu12 0.6.2 nvidia-nccl-cu12 2.21.5
nvidia-nvjitlink-cu12 12.4.127 nvidia-nvtx-cu12 12.4.127 oauthlib 3.2.0
oci 2.150.0 openai 1.69.0 opencensus 0.11.4
opencensus-context 0.1.3 OpenTelemetry API 1.32.0 opentelemetry-sdk(开源遥测软件开发工具包) 1.32.0
opentelemetry-semantic-conventions 0.53b0 opt_einsum 3.4.0 optree 0.15.0
optuna 3.6.1 optuna集成 3.6.0 orjson 3.10.16
重写 7.4.0 包装 24.1 熊猫 1.5.3
pandocfilters 1.5.0 paramiko 3.4.0 帕尔索 0.8.3
pathspec 0.10.3 替罪羊 0.5.6 pexpect 4.8.0
Φ系数 0.12.4 枕头 10.3.0 果仁 24.2
platformdirs 3.10.0 plotly 5.22.0 Pluggy (Python库) 1.0.0
pmdarima 2.0.4 狗狗 1.8.2 preshed 3.0.9
prometheus-client 0.14.1 prompt-toolkit 3.0.43 先知 1.1.6
proto-plus 1.26.1 protobuf 4.24.1 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo 9.0.0 py-spy(Python程序性能分析工具) 0.4.0 pyarrow 15.0.2
pyasn1 0.4.8 pyasn1-modules 0.2.8 pybind11 2.13.6
pyccolo 0.0.65 Python代码解析器 2.21 pydantic 2.8.2
pydantic_core 2.20.1 pyflakes 3.2.0 Pygments 2.15.1
PyGObject 3.48.2 PyJWT 2.7.0 PyNaCl 1.5.0
pyodbc 5.0.1 pyOpenSSL 24.0.0 pyparsing 3.0.9
pyright 1.1.294 pytesseract 0.3.10 python-dateutil 2.9.0.post0
Python代码编辑器 1.0.4 python-json-logger 2.0.7 python-lsp-jsonrpc 1.1.2
python-lsp-server 1.10.0 python-snappy 0.6.1 pytoolconfig 1.2.6
pytorch-ranger(PyTorch优化器库) 0.1.1 pytz 2024.1 PyWavelets 1.5.0
PyYAML 6.0.1 pyzmq 25.1.2 问卷 2.1.0
射线 2.37.0 引用 0.30.2 正则表达式 2023年10月3日
请求 2.32.2 requests-oauthlib 1.3.1 requests-toolbelt 1.0.0
rfc3339-validator 0.1.4 rfc3986验证器 0.1.1 13.3.5
绳子 1.12.0 rpds-py 0.10.6 rsa 4.9
ruamel.yaml 0.18.10 ruamel.yaml.clib 0.2.12 s3transfer 0.10.2
safetensors 0.4.4 scikit-image 0.23.2 scikit-learn 1.4.2
scipy 1.13.1 seaborn 0.13.2 Send2Trash 1.8.2
sentence-transformers (句子转换器) 3.4.1 sentencepiece 0.2.0 setuptools 74.0.0
沙普 0.46.0 谢灵汉姆 1.5.4 simplejson 3.17.6
6 1.16.0 切片机 0.0.8 smart-open 5.2.1
smmap 5.0.0 思尼菲欧 1.3.0 音频文件 0.12.1
汤滤器 2.5 soxr 0.5.0.post1 spacy 3.7.5
spacy-legacy 3.0.12 spacy-loggers 1.0.5 SQLAlchemy 2.0.30
sqlparse 0.4.2 srsly 2.5.1 ssh-import-id 5.11
堆栈数据 0.2.0 斯塔尼奥 0.5.1 starlette 0.46.2
statsmodels 0.14.2 sympy 1.13.1 制表 0.9.0
tangled -up-in-unicode 0.2.0 毅力 8.2.2 TensorBoard 2.17.0
TensorBoard数据服务器 0.7.2 tensorboard-profile插件 2.17.0 tensorboardX 2.6.2.2
TensorFlow 2.17.0 tensorflow-estimator 2.15.0 termcolor 3.0.1
完成 0.17.1 文本 3.1.0 tf_keras 2.17.0
thinc 8.2.5 threadpoolctl 2.2.0 tifffile 2023.4.12
tiktoken 0.7.0 tinycss2 1.2.1 tokenize-rt 4.2.1
分词器 0.21.0 tomli 2.0.1 火炬 2.6.0+cu124
torch优化器 0.3.0 torcheval 0.0.7 torchmetrics 1.6.0
炬视讯 0.21.0+cu124 龙卷风 6.4.1 tqdm 4.66.4
Traitlets 5.14.3 变压器 4.50.2 氚核 3.2.0
typeguard 4.4.2 打字员 0.15.2 types-protobuf 3.20.3
types-psutil 5.9.0 types-pytz 2023.3.1.1 types-PyYAML 6.0.0
请求类型 2.31.0.0 types-setuptools(类型-安装工具包) 68.0.0.0 类型六 1.16.0
types-urllib3 1.26.25.14 输入扩展 (typing_extensions) 4.11.0 uc-micro-py 1.0.1
ujson 5.10.0 无人参与升级 0.1 URI 模板 1.3.0
urllib3 1.26.16 uvicorn 0.34.1 验证者 0.34.0
virtualenv 20.26.2 愿景 0.7.5 wadllib 1.3.6
山葵 1.1.3 wcwidth 0.2.5 黄鼠狼 0.4.1
webcolors 24.11.1 Web编码 0.5.1 WebSocket客户端 1.8.0
WebSockets 11.0.3 Werkzeug 3.0.3 whatthepatch 1.0.2
轮子 0.43.0 wordcloud 1.9.4 裹住 1.14.1
XGBoost 2.0.3 xgboost-ray 0.1.19 xxhash 3.4.1
yapf 0.33.0 雅尔 1.9.3 ydata-profiling 4.9.0
齐普 3.17.0 zstd 1.5.5.1

R 软件库

R 库与 Databricks Runtime 16.4 LTS 中的 R 库 相同。

Java 库和 Scala 库(Scala 2.12 群集)

除了 Databricks Runtime 16.4 LTS 中的 Java 和 Scala 库外,Databricks Runtime 16.4 LTS ML 还包含以下 JAR:

CPU 群集

群组标识符 工件编号 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.4-db1-spark3.5
org.mlflow mlflow-client 2.15.1
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0

GPU 群集

群组标识符 工件编号 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.4-db1-spark3.5
org.mlflow mlflow-client 2.15.1
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0