此页是 SQL Server 大数据群集的笔记本索引。 这些可执行笔记本(.ipynb)管理 SQL Server 2019 的大数据群集。
重要
Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章和 Microsoft SQL Server 平台上的大数据选项。
可以使用 Jupyter 笔记本管理 SQL Server 大数据群集。 执行此作时,所有笔记本都会检查其自己的依赖项。 “运行所有单元格”选项成功完成,或者向另一个笔记本发出超链接提示引发异常,以解决缺少的依赖项。 点击指向目标笔记本的超链接,然后单击运行所有单元格。 成功完成后,返回到原始笔记本,然后选择“ 运行所有单元格”。
安装所有依赖项并 运行所有单元格 失败时,每个笔记本都会分析结果。 在可能的情况下,超链接提示提供了有关如何解决问题的方向。
- 有关使用笔记本管理 SQL Server 大数据群集的详细信息,请参阅 使用 Azure Data Studio 笔记本管理 SQL Server 大数据群集。
- 如需了解大数据群集管理笔记本的位置,请参阅在何处查找 SQL Server 大数据群集管理笔记本。
在大数据群集上安装和卸载实用工具
下面是一组可用于安装和卸载命令行工具的笔记本。 它们还提供用于管理 SQL Server 大数据群集的包。
名称 | DESCRIPTION |
---|---|
SOP012 - 安装 unixodbc for Mac | 在使用 brew 安装 ODBC for SQL Server 时收到错误时,请使用此笔记本。 |
SOP036 - 安装 kubectl 命令行接口 | 使用此笔记本安装 kubectl 命令行接口,而不考虑 OS。 |
SOP037 - 卸载 kubectl 命令行接口 | 使用此笔记本可以卸载 kubectl 命令行接口,而不考虑 OS。 |
SOP038 - 安装 Azure 命令行接口 | 使用此笔记本安装 Azure CLI 命令行接口,而不考虑 OS。 |
SOP040 - 在 ADS Python 沙盒中升级 pip | 使用此笔记本升级 ADS Python 沙盒中的 pip。 |
SOP059 - 安装 Kubernetes Python 模块 | 使用此笔记本通过 Python 安装 Kubernetes 模块。 |
SOP060 - 卸载 kubernetes 模块 | 使用此笔记本通过 Python 卸载 Kubernetes 模块。 |
SOP062 - 安装 ipython-sql 和 pyodbc 模块 | 使用此笔记本安装 ipython-sql 和 pyodbc 模块。 |
SOP069 - 安装 ODBC for SQL Server | 使用此笔记本安装 ODBC 驱动程序,因为 azdata 中的某些子命令需要 SQL Server ODBC 驱动程序。 |
备份和还原大数据群集
下面是一组用于 SQL Server 大数据群集上备份和还原操作的笔记本文件。
名称 | DESCRIPTION |
---|---|
SOP008 - 使用 distcp 将 HDFS 文件备份到 Azure Data Lake Store Gen2 | 此标准作过程(SOP)将数据从源大数据群集的 HDFS 文件系统备份到指定的 Azure Data Lake Store Gen2 帐户。 请确保 Azure Data Lake Store Gen2 帐户已配置已启用“分层命名空间”。 |
管理大数据群集上的证书
下面是一组笔记本,用于管理大数据群集上的证书。
名称 | DESCRIPTION |
---|---|
CER001 - 生成根 CA 证书 | 生成根 CA 证书。 请考虑对每个环境中所有非生产群集使用一个根 CA 证书,因为此技术减少了需要上传到连接到这些群集的客户端的根 CA 证书的数量。 |
CER002 - 下载现有的根 CA 证书 | 使用此笔记本从群集下载生成的根 CA 证书。 |
CER003 - 上传现有的根 CA 证书 | CER003 - 上传现有的根 CA 证书。 |
CER004 - 下载并上传现有的根 CA 证书 | 下载并上传现有的根 CA 证书。 |
CER005 - 安装新的根 CA 证书 | 安装新的根 CA 证书。 |
CER010 - 在本地安装生成的根 CA | 此笔记本将从大数据群集中本地复制通过 CER001 - 生成根 CA 证书 或 CER003 - 上传现有的根 CA 证书 安装的生成的根 CA 证书,然后将根 CA 证书安装到这台计算机的本地证书存储中。 |
CER020 - 创建管理代理证书 | 此笔记本为管理代理终结点创建证书。 |
CER021 - 创建 Knox 证书 | 此笔记本为 Knox 网关终结点创建证书。 |
CER022 - 创建应用代理证书 | 此笔记本为应用部署代理终结点创建证书。 |
CER023 - 创建主证书 | 这个笔记本用于为主终结点创建证书。 |
CER024 - 创建控制器证书 | 此笔记本为控制器终结点创建证书。 |
CER025 - 上传现有管理代理证书 | 此笔记本上传现有的管理代理证书。 |
CER026 - 上传现有网关证书 | 此笔记本将外部生成的网关证书上传到群集。 |
CER027 - 上传现有的应用服务代理证书 | 此笔记本将外部生成的应用服务证书上传到群集。 |
CER028 - 上传现有主证书 | 此笔记本将外部生成的主证书上传到群集。 |
CER028 - 上传现有控制器证书 | 此笔记本将外部生成的控制器证书上传到群集。 |
CER030 - 使用生成的 CA 对管理代理证书进行签名 | 此笔记本使用生成的根 CA 证书对使用CER020 - 创建管理代理证书创建的证书进行签名。根 CA 证书是通过 CER001 - 生成根 CA 证书 或CER003 - 上传现有的根 CA 证书生成的。 |
CER031 - 使用生成的 CA 对 Knox 证书进行签名 | 此笔记本使用 CER021 创建 证书签名 - 使用生成的根 CA 证书创建 Knox 证书,使用 CER001 创建 - 生成根 CA 证书 或 CER003 - 上传现有的根 CA 证书 |
CER032 - 使用生成的 CA 对 App-Proxy 证书进行签名 | 此笔记本使用生成根 CA 证书签署通过 CER022 - 创建应用代理证书 创建的证书,该根 CA 证书由 CER001 - 生成根 CA 证书 或 CER003 - 上传现有的根 CA 证书 创建。 |
CER033 - 使用生成的 CA 对 Master 证书进行签名 | 此笔记本通过使用CER023 - 创建主证书生成的主证书,对根CA证书进行签名,该证书是通过使用CER001 - 生成根CA证书或者CER003 - 上传现有的根CA证书生成的。 |
CER034 - 使用生成的 CA 对控制器证书进行签名 | 此笔记本通过使用生成的根 CA 证书对使用 CER024 - 创建控制器证书 创建的证书进行签名。该根 CA 证书是通过 CER001 - 生成根 CA 证书 或 CER003 - 上传现有根 CA 证书 创建的。 |
CER040 - 安装签名的管理代理证书 | 此笔记本将安装到大数据群集中,该群集使用 CER030 - 使用生成的 CA 对管理代理证书进行签名。 |
CER041 - 安装签名的 Knox 证书 | 此笔记本将安装到大数据集群中,并使用 CER031 - 使用生成的 CA 签署 Knox 证书。 |
CER042 - 安装已签名的 App-Proxy 证书 | 此笔记本将在大数据群集中安装使用 CER032 - 使用生成的 CA 对 App-Proxy 证书进行签名 的证书。 |
CER043 - 安装签名的主证书 | 此笔记本将在大数据群集中安装使用CER033 - 使用群集根 CA 签名的主证书。请注意,在执行完此笔记本后,主节点的 Pod 将重启以加载新证书。 |
CER044 - 安装签名的控制器证书 | 此笔记本将在大数据群集中安装使用CER034 - 使用群集根 CA 对控制器证书进行签名的证书。请注意,在运行该笔记本的末尾,控制器 Pods 以及所有使用 PolyBase 的 Pods(包括主池和计算池 Pods)将被重启以加载新证书。 |
CER050 - 等待 BDC 恢复正常状态 | 在重启控制器 Pod 并使用 PolyBase 的 Pod 以加载新证书后,此笔记本将等到大数据群集恢复到正常状态。 |
CER100 - 使用自签名证书配置群集 | 此笔记本将在大数据群集中生成新的根 CA,并为每个终结点创建新证书(这些终结点为:管理、网关、应用代理和控制器)。 使用新生成的根 CA 对每个新证书进行签名,控制器证书(使用现有群集根 CA 签名)除外,然后将每个证书安装到大数据群集中。 将新生成的根 CA 下载到此计算机的受信任根证书颁发机构证书存储中。 所有生成的自签名证书都将存储在test_cert_store_root位置的控制器 Pod 中。 |
CER101 - 使用现有根 CA 配置具有自签名证书的群集 | 此笔记本将使用大数据集群中现有的生成的根 CA(通过 CER003 上传),为每个终结点(管理、网关、App-Proxy 和控制器)创建新证书。然后,用新生成的根 CA 对除控制器证书以外的每个新证书进行签名,而控制器证书将使用现有的集群根 CA 进行签名。最后,将每个证书安装到大数据集群中。 所有生成的自签名证书都将存储在控制器 Pod 中,位于 test_cert_store_root 位置。 完成此笔记本后,从这台计算机(以及安装新根 CA 的任何计算机)通过 https:// 访问大数据集群的所有连接都将显示为安全。 Notebook Runner 部分将确保创建 CronJobs(OPR003)以运行 App-Deploy,并安装群集根 CA,从而能够安全地获取 JWT 令牌和 swagger.json。 |
CER102 - 使用现有的大数据群集 CA 配置具有自签名证书的群集 | 此笔记本将使用现有的大数据群集 CA 来配置具有自签名证书的群集。 阅读笔记本了解详细信息。 |
CER103 - 使用外部签名证书配置集群 | 此笔记本旨在替换终结点证书,使用大数据群集外部生成和签名的证书。 阅读笔记本了解详细信息。 |
大数据群集上的静态加密实用工具
本部分包含一组笔记本,用于管理 BDC 上的静态加密。
名称 | DESCRIPTION |
---|---|
SOP0124 - 列出用于静态数据加密的密钥 | 使用此笔记本列出所有 HDFS 密钥。 |
SOP0128 - 在大数据群集中启用 HDFS 加密区域 | 从 CU6 或以前的 CU6 升级到 CU8 时,使用此笔记本启用 HDFS 加密区域。 在 CU8+ 的新部署或升级到 CU9 时不需要。 |
SOP0125 - 删除静态加密密钥 | 使用此笔记本删除 HDFS 加密区域密钥。 谨慎! |
SOP0126 - 用于静态加密的备份密钥 | 使用此笔记本备份 HDFS 加密区域密钥。 |
SOP0127 - 还原静态加密密钥 | 使用此笔记本还原 HDFS 加密区域密钥。 |
密码轮换
用于管理大数据群集上的密码轮换的笔记本。
名称 | DESCRIPTION |
---|---|
PASS001 - 更新管理员域控制器密码 | 此笔记本假定 DSA 密码已在域控制器中更新。 使用给定参数运行此笔记本,以使用新的 DSA 密码更新大数据群集。 这将重启控制器 Pod。 |
后续步骤
有关 SQL Server 大数据群集的详细信息,请参阅 SQL Server 2019 大数据群集简介。