注释
对此 Databricks Runtime 版本的支持已结束。 有关终止支持日期,请参阅终止支持历史记录。 有关所有受支持的 Databricks Runtime 版本,请参阅 Databricks Runtime 发行说明版本和兼容性。
用于机器学习的 Databricks Runtime 15.2 提供了基于 Databricks Runtime 15.2 (EoS) 的机器学习和数据科学的就绪to-go 环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 Horovod 进行分布式深度学习训练。
小窍门
若要查看已终止支持 (EoS) 的 Databricks Runtime 版本的发行说明,请参阅终止支持 Databricks Runtime 发行说明。 EoS Databricks Runtime 版本已停用,可能不会更新。
新功能和改进
Databricks Runtime 15.2 ML 基于 Databricks Runtime 15.2 构建。 有关 Databricks Runtime 15.2 中的新增功能(包括 Apache Spark MLlib 和 SparkR)的信息,请参阅 Databricks Runtime 15.2 (EoS) 发行说明。
添加 StreamingDataset
云存储中的大型数据集的训练可以通过 StreamingDataset 来实现,其目的是做到尽可能的快速、廉价和可扩展。 它预安装在 Databricks Runtime 15.2 ML 中。
Databricks Runtime ML 的 CPU 群集上的 Photon 支持功能
从 Databricks Runtime 15.2 ML 开始,可以通过在 CPU 群集上启用 Photon 来加速 Spark SQL 和 Spark 数据帧工作负荷。
对于机器学习应用程序,Photon 为用例提供更快的性能,例如:
- 使用 SQL 或数据帧 API 进行数据准备。
- 使用时间点查找进行特征工程。
- 使用 GraphFrames 进行图形分析。
Photon 不会增强 Python 库的性能,例如 TensorFlow、PyTorch 和 XGBoost。
Spark RDD API 和 Spark MLlib 与 Photon 的兼容性有限。 使用 Spark RDD 或 Spark MLlib 处理大型数据集时,可能会遇到 Spark 内存问题。 请参阅 Spark 内存问题。
系统环境
Databricks Runtime 15.2 ML 中的系统环境不同于 Databricks Runtime 15.2,如下所示:
- 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
- CUDA 12.1
- cusolver 11.4.5.107-1
- cupti 12.1
- cuDNN 8.9.0.131-1
- NCCL 2.17.1
- TensorRT 8.6.1.6-1
图书馆
以下部分列出了 Databricks Runtime 15.2 ML 中包含的库,这些库不同于 Databricks Runtime 15.2 中包含的库。
本节内容:
顶级图书馆
Databricks Runtime 15.2 ML 包含以下顶级 库:
Python 库
Databricks Runtime 15.2 ML 用于 virtualenv
Python 包管理,并包括许多常用的 ML 包。
除了以下部分中指定的包外,Databricks Runtime 15.2 ML 还包括以下包:
- hyperopt 0.2.7+db3
- sparkdl 3.0.0_db1
- automl 1.26.0
若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-15.2.txt 文件并运行 pip install -r requirements-15.2.txt
。 此命令安装 Databricks Runtime ML 使用的所有开源库,但不安装 Databricks 开发的库,例如 databricks-automl
、databricks-feature-engineering
或 hyperopt
的 Databricks 分支。
CPU 群集上的 Python 库
图书馆 | 版本 | 图书馆 | 版本 | 图书馆 | 版本 |
---|---|---|---|---|---|
ABSL-PY 系列 | 1.0.0 | 加速 | 0.28.0 | aiohttp | 3.8.5 |
aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | anyio | 3.5.0 |
argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 | 阿斯托尔 | 0.8.1 |
asttokens | 2.0.5 | astunparse | 1.6.3 | 异步-超时 | 4.0.2 |
属性 | 22.1.0 | audioread | 3.0.1 | azure-core | 1.30.1 |
azure-cosmos | 4.3.1 | Azure 身份识别 | 1.16.0 | azure-storage-blob | 12.19.1 |
Azure存储文件数据湖 | 12.14.0 | 回调 | 0.2.0 | bcrypt | 3.2.0 |
beautifulsoup4 | 4.12.2 | 黑色 | 23.3.0 | 漂白剂 | 4.1.0 |
闪烁器 | 1.4 | 布利斯 | 0.7.11 | boto3 | 1.34.39 |
botocore | 1.34.39 | Brotli | 1.0.9 | cachetools (缓存工具) | 5.3.3 |
目录 | 2.0.10 | 类别编码器 | 2.6.3 | certifi | 2023.7.22 |
cffi | 1.15.1 | chardet | 4.0.0 | charset-normalizer (字符集正常化工具) | 2.0.4 |
断路器 | 1.4.0 | 点击 | 8.0.4 | cloudpathlib | 0.16.0 |
cloudpickle | 2.2.1 | cmdstanpy | 1.2.2 | 丰富多彩 | 0.5.6 |
通讯 | 0.1.2 | 糖果 | 0.1.4 | config解析器 | 5.2.0 |
contourpy | 1.0.5 | 密码学 | 41.0.3 | 骑行者 | 0.11.0 |
cymem | 2.0.8 | Cython | 0.29.32 | 英安岩 | 1.8.1 |
databricks-automl-runtime | 0.2.21 | Databricks-特征工程 | 0.4.0 | Databricks软件开发工具包 (databricks-sdk) | 0.20.0 |
dataclasses-json | 0.6.4 | 数据集 | 2.18.0 | dbl-tempo | 0.1.26 |
dbus-python | 1.2.18 | debugpy | 1.6.7 | 装饰师 | 5.1.1 |
deepspeed | 0.14.0 | defusedxml | 0.7.1 | 莳萝 | 0.3.6 |
磁盘缓存 | 5.6.3 | distlib | 0.3.8 | dm-tree | 0.1.8 |
入口点 | 0.4 | 评价 | 0.4.1 | 正在执行 | 0.8.3 |
各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 | fastjsonschema | 2.19.1 |
fasttext | 0.9.2 | 文件锁 (filelock) | 3.9.0 | 烧瓶 | 2.2.5 |
FlatBuffers | 24.3.25 | fonttools(字体工具) | 4.25.0 | frozenlist | 1.3.3 |
fsspec | 2023.5.0 | 未来 | 0.18.3 | 加斯特 | 0.4.0 |
gitdb (Git数据库) | 4.0.11 | GitPython | 3.1.27 | google-api-core | 2.18.0 |
google-auth (谷歌身份验证) | 2.21.0 | google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 |
谷歌云存储 (Google Cloud Storage) | 2.10.0 | google-crc32c | 1.5.0 | google-pasta | 0.2.0 |
google-resumable-media(谷歌可恢复媒体) | 2.7.0 | googleapis-common-protos | 1.63.0 | 绿地 | 2.0.1 |
grpcio | 1.60.0 | grpcio-status | 1.60.0 | gunicorn | 20.1.0 |
gviz-api | 1.10.0 | 体育馆 | 0.28.1 | h11 | 0.14.0 |
h5py | 3.10.0 | hjson | 3.1.0 | 假期 | 0.45 |
霍罗沃德 | 0.28.1+db1 | htmlmin | 0.1.12 | httpcore | 1.0.5 |
httplib2 | 0.20.2 | httpx | 0.27.0 | huggingface-hub(哈根脸社区平台) | 0.20.2 |
IDNA | 3.4 | ImageHash | 4.3.1 | ImageIO | 2.31.1 |
imbalanced-learn | 0.11.0 | importlib-metadata | 6.0.0 | importlib_resources | 6.4.0 |
ipyflow-core | 0.0.198 | ipykernel | 6.25.1 | ipython | 8.15.0 |
ipython-genutils(IPython通用工具) | 0.2.0 | ipywidgets | 8.0.4 | isodate | 0.6.1 |
它很危险 | 2.0.1 | Jax-Jumpy | 1.0.0 | jedi | 0.18.1 |
吉普尼 | 0.7.1 | Jinja2 | 3.1.2 | jmespath | 0.10.0 |
joblib | 1.2.0 | joblibspark | 0.5.1 | JSON补丁 | 1.33 |
jsonpointer | 2.4 | jsonschema | 4.17.3 | Jupyter 服务器 | 1.23.4 |
jupyter_client(Jupyter 客户端) | 7.4.9 | jupyter_core(Jupyter核心) | 5.3.0 | jupyterlab-pygments | 0.1.2 |
jupyterlab-widgets | 3.0.5 | keras | 3.1.1 | 钥匙圈 | 23.5.0 |
kiwisolver | 1.4.4 | langchain | 0.1.13 | Langchain社区 | 0.0.32 |
langchain-core | 0.1.41 | langchain-文本分割器 | 0.0.1 | 语言代码 | 3.3.0 |
langsmith | 0.1.45 | launchpadlib | 1.10.16 | lazr.restfulclient | 0.14.4 |
lazr.uri | 1.0.6 | lazy_loader | 0.2 | libclang | 15.0.6.1 |
librosa | 0.10.1 | lightgbm | 4.3.0 | LLVMlite | 0.40.0 |
lxml | 4.9.2 | lz4 | 4.3.2 | Mako | 1.2.0 |
Markdown | 3.4.1 | markdown-it-py | 2.2.0 | MarkupSafe | 2.1.1 |
棉花糖 | 3.21.1 | matplotlib | 3.7.2 | matplotlib-inline | 0.1.6 |
mdurl | 0.1.0 | mistune | 0.8.4 | ml-dtypes | 0.3.2 |
mlflow-skinny | 2.11.3 | more-itertools | 8.10.0 | mosaicml-streaming | 0.7.4 |
mpmath | 1.3.0 | MSAL | 1.28.0 | msal-extensions | 1.1.0 |
msgpack | 1.0.8 | 多重字典 | 6.0.2 | 多方法 | 1.11.2 |
多进程 | 0.70.14 | murmurhash | 1.0.10 | mypy-extensions | 0.4.3 |
namex | 0.0.7 | nbclassic | 0.5.5 | nbclient | 0.5.13 |
nbconvert | 6.5.4 | nbformat | 5.7.0 | nest-asyncio | 1.5.6 |
NetworkX | 3.1 | 忍者 | 1.11.1.1 | nltk | 3.8.1 |
笔记本 | 6.5.4 | notebook_shim | 0.2.2 | 麻木 | 0.57.1 |
numpy | 1.23.5 | oauthlib | 3.2.0 | oci | 2.125.2 |
openai | 1.14.3 | opencensus | 0.11.4 | opencensus-context | 0.1.3 |
opt-einsum | 3.3.0 | optree | 0.11.0 | orjson | 3.10.0 |
包装 | 23.2 | 熊猫 | 1.5.3 | pandocfilters | 1.5.0 |
paramiko | 3.4.0 | 帕尔索 | 0.8.3 | pathspec | 0.10.3 |
替罪羊 | 0.5.3 | petastorm | 0.12.1 | pexpect | 4.8.0 |
Φ系数 | 0.12.4 | pickleshare | 0.7.5 | 枕头 | 9.4.0 |
果仁 | 23.2.1 | platformdirs | 3.10.0 | plotly | 5.9.0 |
pmdarima | 2.0.4 | 狗狗 | 1.8.1 | portalocker | 2.8.2 |
preshed | 3.0.9 | prometheus-client | 0.14.1 | prompt-toolkit | 3.0.36 |
先知 | 1.1.5 | proto-plus | 1.23.0 | protobuf | 4.24.1 |
psutil | 5.9.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
pure-eval | 0.2.2 | py-cpuinfo | 8.0.0 | py-spy(Python程序性能分析工具) | 0.3.14 |
pyarrow | 14.0.1 | pyarrow-hotfix | 0.6 | pyasn1 | 0.4.8 |
pyasn1-modules | 0.2.8 | pybind11 | 2.12.0 | pyccolo | 0.0.52 |
Python代码解析器 | 2.21 | pydantic | 1.10.6 | Pygments | 2.15.1 |
PyGObject | 3.42.1 | PyJWT | 2.3.0 | PyNaCl | 1.5.0 |
pynvml | 11.5.0 | pyodbc | 4.0.38 | pyOpenSSL | 23.2.0 |
pyparsing | 3.0.9 | pyrsistent(持久性,类似于 persistent 的 Python 包) | 0.18.0 | pytesseract | 0.3.10 |
python-dateutil | 2.8.2 | Python代码编辑器 | 1.0.4 | python-lsp-jsonrpc | 1.1.1 |
python-snappy | 0.6.1 | pytz | 2022年7月 | PyWavelets | 1.4.1 |
PyYAML | 6.0 | pyzmq | 23.2.0 | 射线 | 2.10.0 |
正则表达式 | 2022.7.9 | 请求 | 2.31.0 | requests-oauthlib | 1.3.1 |
回应 | 0.13.3 | 富 | 13.7.1 | rsa | 4.9 |
s3transfer | 0.10.1 | safetensors | 0.4.2 | scikit-image | 0.20.0 |
scikit-learn | 1.3.0 | scipy | 1.11.1 | seaborn | 0.12.2 |
SecretStorage | 3.3.1 | Send2Trash | 1.8.0 | sentence-transformers (句子转换器) | 2.6.1 |
sentencepiece | 0.1.99 | setuptools | 68.0.0 | 沙普 | 0.44.0 |
simplejson | 3.17.6 | 6 | 1.16.0 | 切片机 | 0.0.7 |
smart-open | 5.2.1 | smmap | 5.0.0 | 思尼菲欧 | 1.2.0 |
音频文件 | 0.12.1 | 汤滤器 | 2.4 | soxr | 0.3.7 |
spacy | 3.7.2 | spacy-legacy | 3.0.12 | spacy-loggers | 1.0.5 |
spark-tensorflow-distributor | 1.0.0 | SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 |
srsly | 2.4.8 | ssh-import-id | 5.11 | 堆栈数据 | 0.2.0 |
斯塔尼奥 | 0.5.0 | statsmodels | 0.14.0 | sympy | 1.11.1 |
tangled -up-in-unicode | 0.2.0 | 毅力 | 8.2.2 | TensorBoard | 2.16.2 |
TensorBoard数据服务器 | 0.7.2 | tensorboard_plugin_profile | 2.15.1 | tensorboardX | 2.6.2.2 |
tensorflow-cpu | 2.16.1 | tensorflow-estimator | 2.15.0 | tensorflow-io-gcs-filesystem | 0.36.0 |
termcolor | 2.4.0 | 完成 | 0.17.1 | thinc | 8.2.3 |
threadpoolctl | 2.2.0 | tifffile | 2021年7月2日 | tiktoken | 0.5.2 |
tinycss2 | 1.2.1 | tokenize-rt | 4.2.1 | 分词器 | 0.15.0 |
火炬 | 2.2.2+cpu | torcheval | 0.0.7 | 炬视讯 | 0.17.2+cpu |
龙卷风 | 6.3.2 | tqdm | 4.65.0 | Traitlets | 5.7.1 |
变压器 | 4.39.2 | typeguard | 2.13.3 | 打字员 | 0.9.4 |
输入检查 | 0.9.0 | 输入扩展 (typing_extensions) | 4.10.0 | tzdata | 2022年1月 |
ujson | 5.4.0 | 无人参与升级 | 0.1 | urllib3 | 1.26.16 |
virtualenv | 20.21.0 | 愿景 | 0.7.5 | wadllib | 1.3.6 |
山葵 | 1.1.2 | wcwidth | 0.2.5 | 黄鼠狼 | 0.3.4 |
Web编码 | 0.5.1 | WebSocket客户端 | 0.58.0 | Werkzeug | 2.2.3 |
轮子 | 0.38.4 | widgetsnbextension | 4.0.5 | wordcloud | 1.9.3 |
裹住 | 1.14.1 | XGBoost | 2.0.3 | xxhash | 3.4.1 |
雅尔 | 1.8.1 | ydata-profiling | 4.5.1 | 齐普 | 3.11.0 |
GPU 群集上的 Python 库
图书馆 | 版本 | 图书馆 | 版本 | 图书馆 | 版本 |
---|---|---|---|---|---|
ABSL-PY 系列 | 1.0.0 | 加速 | 0.28.0 | aiohttp | 3.8.5 |
aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | anyio | 3.5.0 |
argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 | 阿斯托尔 | 0.8.1 |
asttokens | 2.0.5 | astunparse | 1.6.3 | 异步-超时 | 4.0.2 |
属性 | 22.1.0 | audioread | 3.0.1 | azure-core | 1.30.1 |
azure-cosmos | 4.3.1 | Azure 身份识别 | 1.16.0 | azure-storage-blob | 12.19.1 |
Azure存储文件数据湖 | 12.14.0 | 回调 | 0.2.0 | bcrypt | 3.2.0 |
beautifulsoup4 | 4.12.2 | 黑色 | 23.3.0 | 漂白剂 | 4.1.0 |
闪烁器 | 1.4 | 布利斯 | 0.7.11 | boto3 | 1.34.39 |
botocore | 1.34.39 | Brotli | 1.0.9 | cachetools (缓存工具) | 5.3.3 |
目录 | 2.0.10 | 类别编码器 | 2.6.3 | certifi | 2023.7.22 |
cffi | 1.15.1 | chardet | 4.0.0 | charset-normalizer (字符集正常化工具) | 2.0.4 |
断路器 | 1.4.0 | 点击 | 8.0.4 | cloudpathlib | 0.16.0 |
cloudpickle | 2.2.1 | cmdstanpy | 1.2.2 | 丰富多彩 | 0.5.6 |
通讯 | 0.1.2 | 糖果 | 0.1.4 | config解析器 | 5.2.0 |
contourpy | 1.0.5 | 密码学 | 41.0.3 | 骑行者 | 0.11.0 |
cymem | 2.0.8 | Cython | 0.29.32 | 英安岩 | 1.8.1 |
databricks-automl-runtime | 0.2.21 | Databricks-特征工程 | 0.4.0 | Databricks软件开发工具包 (databricks-sdk) | 0.20.0 |
dataclasses-json | 0.6.4 | 数据集 | 2.18.0 | dbl-tempo | 0.1.26 |
dbus-python | 1.2.18 | debugpy | 1.6.7 | 装饰师 | 5.1.1 |
deepspeed | 0.14.0 | defusedxml | 0.7.1 | 莳萝 | 0.3.6 |
磁盘缓存 | 5.6.3 | distlib | 0.3.8 | dm-tree | 0.1.8 |
einops | 0.7.0 | 入口点 | 0.4 | 评价 | 0.4.1 |
正在执行 | 0.8.3 | 各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 |
fastjsonschema | 2.19.1 | fasttext | 0.9.2 | 文件锁 (filelock) | 3.9.0 |
flash-attn | 2.5.6 | 烧瓶 | 2.2.5 | FlatBuffers | 24.3.25 |
fonttools(字体工具) | 4.25.0 | frozenlist | 1.3.3 | fsspec | 2023.5.0 |
未来 | 0.18.3 | 加斯特 | 0.4.0 | gitdb (Git数据库) | 4.0.11 |
GitPython | 3.1.27 | google-api-core | 2.18.0 | google-auth (谷歌身份验证) | 2.21.0 |
google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 | 谷歌云存储 (Google Cloud Storage) | 2.10.0 |
google-crc32c | 1.5.0 | google-pasta | 0.2.0 | google-resumable-media(谷歌可恢复媒体) | 2.7.0 |
googleapis-common-protos | 1.63.0 | 绿地 | 2.0.1 | grpcio | 1.60.0 |
grpcio-status | 1.60.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
体育馆 | 0.28.1 | h11 | 0.14.0 | h5py | 3.10.0 |
hjson | 3.1.0 | 假期 | 0.45 | 霍罗沃德 | 0.28.1+db1 |
htmlmin | 0.1.12 | httpcore | 1.0.5 | httplib2 | 0.20.2 |
httpx | 0.27.0 | huggingface-hub(哈根脸社区平台) | 0.20.2 | IDNA | 3.4 |
ImageHash | 4.3.1 | ImageIO | 2.31.1 | imbalanced-learn | 0.11.0 |
importlib-metadata | 6.0.0 | importlib_resources | 6.4.0 | ipyflow-core | 0.0.198 |
ipykernel | 6.25.1 | ipython | 8.15.0 | ipython-genutils(IPython通用工具) | 0.2.0 |
ipywidgets | 8.0.4 | isodate | 0.6.1 | 它很危险 | 2.0.1 |
Jax-Jumpy | 1.0.0 | jedi | 0.18.1 | 吉普尼 | 0.7.1 |
Jinja2 | 3.1.2 | jmespath | 0.10.0 | joblib | 1.2.0 |
joblibspark | 0.5.1 | JSON补丁 | 1.33 | jsonpointer | 2.4 |
jsonschema | 4.17.3 | Jupyter 服务器 | 1.23.4 | jupyter_client(Jupyter 客户端) | 7.4.9 |
jupyter_core(Jupyter核心) | 5.3.0 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 3.0.5 |
keras | 3.1.1 | 钥匙圈 | 23.5.0 | kiwisolver | 1.4.4 |
langchain | 0.1.13 | Langchain社区 | 0.0.32 | langchain-core | 0.1.41 |
langchain-文本分割器 | 0.0.1 | 语言代码 | 3.3.0 | langsmith | 0.1.45 |
launchpadlib | 1.10.16 | lazr.restfulclient | 0.14.4 | lazr.uri | 1.0.6 |
lazy_loader | 0.2 | libclang | 15.0.6.1 | librosa | 0.10.1 |
lightgbm | 4.3.0 | LLVMlite | 0.40.0 | lxml | 4.9.2 |
lz4 | 4.3.2 | Mako | 1.2.0 | Markdown | 3.4.1 |
markdown-it-py | 2.2.0 | MarkupSafe | 2.1.1 | 棉花糖 | 3.21.1 |
matplotlib | 3.7.2 | matplotlib-inline | 0.1.6 | mdurl | 0.1.0 |
mistune | 0.8.4 | ml-dtypes | 0.3.2 | mlflow-skinny | 2.11.3 |
more-itertools | 8.10.0 | mosaicml-streaming | 0.7.4 | mpmath | 1.3.0 |
MSAL | 1.28.0 | msal-extensions | 1.1.0 | msgpack | 1.0.8 |
多重字典 | 6.0.2 | 多方法 | 1.11.2 | 多进程 | 0.70.14 |
murmurhash | 1.0.10 | mypy-extensions | 0.4.3 | namex | 0.0.7 |
nbclassic | 0.5.5 | nbclient | 0.5.13 | nbconvert | 6.5.4 |
nbformat | 5.7.0 | nest-asyncio | 1.5.6 | NetworkX | 3.1 |
忍者 | 1.11.1.1 | nltk | 3.8.1 | 笔记本 | 6.5.4 |
notebook_shim | 0.2.2 | 麻木 | 0.57.1 | numpy | 1.23.5 |
nvidia-cublas-cu12 | 12.1.3.1 | nvidia-cuda-cupti-cu12 | 12.1.105 | nvidia-cuda-nvrtc-cu12 | 12.1.105 |
nvidia-cuda-runtime-cu12 | 12.1.105 | nvidia-cudnn-cu12 | 8.9.2.26 | nvidia-cufft-cu12 | 11.0.2.54 |
nvidia-curand-cu12 | 10.3.2.106 | nvidia-cusolver-cu12 | 11.4.5.107 | nvidia-cusparse-cu12 | 12.1.0.106 |
nvidia-nccl-cu12 | 2.19.3 | nvidia-nvjitlink-cu12 | 12.4.127 | nvidia-nvtx-cu12 | 12.1.105 |
oauthlib | 3.2.0 | oci | 2.125.2 | openai | 1.14.3 |
opencensus | 0.11.4 | opencensus-context | 0.1.3 | opt-einsum | 3.3.0 |
optree | 0.11.0 | orjson | 3.10.0 | 包装 | 23.2 |
熊猫 | 1.5.3 | pandocfilters | 1.5.0 | paramiko | 3.4.0 |
帕尔索 | 0.8.3 | pathspec | 0.10.3 | 替罪羊 | 0.5.3 |
petastorm | 0.12.1 | pexpect | 4.8.0 | Φ系数 | 0.12.4 |
pickleshare | 0.7.5 | 枕头 | 9.4.0 | 果仁 | 23.2.1 |
platformdirs | 3.10.0 | plotly | 5.9.0 | pmdarima | 2.0.4 |
狗狗 | 1.8.1 | portalocker | 2.8.2 | preshed | 3.0.9 |
prometheus-client | 0.14.1 | prompt-toolkit | 3.0.36 | 先知 | 1.1.5 |
proto-plus | 1.23.0 | protobuf | 4.24.1 | psutil | 5.9.0 |
psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pure-eval | 0.2.2 |
py-cpuinfo | 8.0.0 | py-spy(Python程序性能分析工具) | 0.3.14 | pyarrow | 14.0.1 |
pyarrow-hotfix | 0.6 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
pybind11 | 2.12.0 | pyccolo | 0.0.52 | Python代码解析器 | 2.21 |
pydantic | 1.10.6 | Pygments | 2.15.1 | PyGObject | 3.42.1 |
PyJWT | 2.3.0 | PyNaCl | 1.5.0 | pynvml | 11.5.0 |
pyodbc | 4.0.38 | pyOpenSSL | 23.2.0 | pyparsing | 3.0.9 |
pyrsistent(持久性,类似于 persistent 的 Python 包) | 0.18.0 | pytesseract | 0.3.10 | python-dateutil | 2.8.2 |
Python代码编辑器 | 1.0.4 | python-lsp-jsonrpc | 1.1.1 | python-snappy | 0.6.1 |
pytz | 2022年7月 | PyWavelets | 1.4.1 | PyYAML | 6.0 |
pyzmq | 23.2.0 | 射线 | 2.10.0 | 正则表达式 | 2022.7.9 |
请求 | 2.31.0 | requests-oauthlib | 1.3.1 | 回应 | 0.13.3 |
富 | 13.7.1 | rsa | 4.9 | s3transfer | 0.10.1 |
safetensors | 0.4.2 | scikit-image | 0.20.0 | scikit-learn | 1.3.0 |
scipy | 1.11.1 | seaborn | 0.12.2 | SecretStorage | 3.3.1 |
Send2Trash | 1.8.0 | sentence-transformers (句子转换器) | 2.6.1 | sentencepiece | 0.1.99 |
setuptools | 68.0.0 | 沙普 | 0.44.0 | simplejson | 3.17.6 |
6 | 1.16.0 | 切片机 | 0.0.7 | smart-open | 5.2.1 |
smmap | 5.0.0 | 思尼菲欧 | 1.2.0 | 音频文件 | 0.12.1 |
汤滤器 | 2.4 | soxr | 0.3.7 | spacy | 3.7.2 |
spacy-legacy | 3.0.12 | spacy-loggers | 1.0.5 | spark-tensorflow-distributor | 1.0.0 |
SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 | srsly | 2.4.8 |
ssh-import-id | 5.11 | 堆栈数据 | 0.2.0 | 斯塔尼奥 | 0.5.0 |
statsmodels | 0.14.0 | sympy | 1.11.1 | tangled -up-in-unicode | 0.2.0 |
毅力 | 8.2.2 | TensorBoard | 2.16.2 | TensorBoard数据服务器 | 0.7.2 |
tensorboard_plugin_profile | 2.15.1 | tensorboardX | 2.6.2.2 | TensorFlow | 2.16.1 |
tensorflow-estimator | 2.15.0 | tensorflow-io-gcs-filesystem | 0.36.0 | termcolor | 2.4.0 |
完成 | 0.17.1 | thinc | 8.2.3 | threadpoolctl | 2.2.0 |
tifffile | 2021年7月2日 | tiktoken | 0.5.2 | tinycss2 | 1.2.1 |
tokenize-rt | 4.2.1 | 分词器 | 0.15.0 | 火炬 | 2.2.2+cu121 |
torcheval | 0.0.7 | 炬视讯 | 0.17.2+cu121 | 龙卷风 | 6.3.2 |
tqdm | 4.65.0 | Traitlets | 5.7.1 | 变压器 | 4.39.2 |
氚核 | 2.2.0 | typeguard | 2.13.3 | 打字员 | 0.9.4 |
输入检查 | 0.9.0 | 输入扩展 (typing_extensions) | 4.10.0 | tzdata | 2022年1月 |
ujson | 5.4.0 | 无人参与升级 | 0.1 | urllib3 | 1.26.16 |
virtualenv | 20.21.0 | 愿景 | 0.7.5 | wadllib | 1.3.6 |
山葵 | 1.1.2 | wcwidth | 0.2.5 | 黄鼠狼 | 0.3.4 |
Web编码 | 0.5.1 | WebSocket客户端 | 0.58.0 | Werkzeug | 2.2.3 |
轮子 | 0.38.4 | widgetsnbextension | 4.0.5 | wordcloud | 1.9.3 |
裹住 | 1.14.1 | XGBoost | 2.0.3 | xxhash | 3.4.1 |
雅尔 | 1.8.1 | ydata-profiling | 4.5.1 | 齐普 | 3.11.0 |
zstd | 1.5.5.1 |
R 软件库
R 库与 Databricks Runtime 15.2 中的 R 库 相同。
Java 库和 Scala 库(Scala 2.12 群集)
除了 Databricks Runtime 15.2 中的 Java 和 Scala 库外,Databricks Runtime 15.2 ML 还包含以下 JAR:
CPU 群集
群组标识符 | 工件编号 | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.dmlc | xgboost4j-spark_2.12 | 1.7.3 |
ml.dmlc | xgboost4j_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.3-db1-spark3.5 |
org.mlflow | mlflow-client | 2.11.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |
GPU 群集
群组标识符 | 工件编号 | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.7.3 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.3-db1-spark3.5 |
org.mlflow | mlflow-client | 2.11.1 |
org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |