SQL Server 大数据群集的管理笔记本索引

此页是 SQL Server 大数据群集的笔记本索引。 这些可执行笔记本(.ipynb)管理 SQL Server 2019 的大数据群集。

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

可以使用 Jupyter 笔记本管理 SQL Server 大数据群集。 执行此作时,所有笔记本都会检查其自己的依赖项。 “运行所有单元格”选项成功完成,或者向另一个笔记本发出超链接提示引发异常,以解决缺少的依赖项。 点击指向目标笔记本的超链接,然后单击运行所有单元格。 成功完成后,返回到原始笔记本,然后选择“ 运行所有单元格”。

安装所有依赖项并 运行所有单元格 失败时,每个笔记本都会分析结果。 在可能的情况下,超链接提示提供了有关如何解决问题的方向。

在大数据群集上安装和卸载实用工具

下面是一组可用于安装和卸载命令行工具的笔记本。 它们还提供用于管理 SQL Server 大数据群集的包。

名称 DESCRIPTION
SOP012 - 安装 unixodbc for Mac 在使用 brew 安装 ODBC for SQL Server 时收到错误时,请使用此笔记本。
SOP036 - 安装 kubectl 命令行接口 使用此笔记本安装 kubectl 命令行接口,而不考虑 OS。
SOP037 - 卸载 kubectl 命令行接口 使用此笔记本可以卸载 kubectl 命令行接口,而不考虑 OS。
SOP038 - 安装 Azure 命令行接口 使用此笔记本安装 Azure CLI 命令行接口,而不考虑 OS。
SOP040 - 在 ADS Python 沙盒中升级 pip 使用此笔记本升级 ADS Python 沙盒中的 pip。
SOP059 - 安装 Kubernetes Python 模块 使用此笔记本通过 Python 安装 Kubernetes 模块。
SOP060 - 卸载 kubernetes 模块 使用此笔记本通过 Python 卸载 Kubernetes 模块。
SOP062 - 安装 ipython-sql 和 pyodbc 模块 使用此笔记本安装 ipython-sql 和 pyodbc 模块。
SOP069 - 安装 ODBC for SQL Server 使用此笔记本安装 ODBC 驱动程序,因为 azdata 中的某些子命令需要 SQL Server ODBC 驱动程序。

备份和还原大数据群集

下面是一组用于 SQL Server 大数据群集上备份和还原操作的笔记本文件。

名称 DESCRIPTION
SOP008 - 使用 distcp 将 HDFS 文件备份到 Azure Data Lake Store Gen2 此标准作过程(SOP)将数据从源大数据群集的 HDFS 文件系统备份到指定的 Azure Data Lake Store Gen2 帐户。 请确保 Azure Data Lake Store Gen2 帐户已配置已启用“分层命名空间”。

管理大数据群集上的证书

下面是一组笔记本,用于管理大数据群集上的证书。

名称 DESCRIPTION
CER001 - 生成根 CA 证书 生成根 CA 证书。 请考虑对每个环境中所有非生产群集使用一个根 CA 证书,因为此技术减少了需要上传到连接到这些群集的客户端的根 CA 证书的数量。
CER002 - 下载现有的根 CA 证书 使用此笔记本从群集下载生成的根 CA 证书。
CER003 - 上传现有的根 CA 证书 CER003 - 上传现有的根 CA 证书。
CER004 - 下载并上传现有的根 CA 证书 下载并上传现有的根 CA 证书。
CER005 - 安装新的根 CA 证书 安装新的根 CA 证书。
CER010 - 在本地安装生成的根 CA 此笔记本将从大数据群集中本地复制通过 CER001 - 生成根 CA 证书CER003 - 上传现有的根 CA 证书 安装的生成的根 CA 证书,然后将根 CA 证书安装到这台计算机的本地证书存储中。
CER020 - 创建管理代理证书 此笔记本为管理代理终结点创建证书。
CER021 - 创建 Knox 证书 此笔记本为 Knox 网关终结点创建证书。
CER022 - 创建应用代理证书 此笔记本为应用部署代理终结点创建证书。
CER023 - 创建主证书 这个笔记本用于为主终结点创建证书。
CER024 - 创建控制器证书 此笔记本为控制器终结点创建证书。
CER025 - 上传现有管理代理证书 此笔记本上传现有的管理代理证书。
CER026 - 上传现有网关证书 此笔记本将外部生成的网关证书上传到群集。
CER027 - 上传现有的应用服务代理证书 此笔记本将外部生成的应用服务证书上传到群集。
CER028 - 上传现有主证书 此笔记本将外部生成的主证书上传到群集。
CER028 - 上传现有控制器证书 此笔记本将外部生成的控制器证书上传到群集。
CER030 - 使用生成的 CA 对管理代理证书进行签名 此笔记本使用生成的根 CA 证书对使用CER020 - 创建管理代理证书创​​建的证书进行签名。根 CA 证书是通过 CER001 - 生成根 CA 证书CER003 - 上传现有的根 CA 证书生成的。
CER031 - 使用生成的 CA 对 Knox 证书进行签名 此笔记本使用 CER021 创建 证书签名 - 使用生成的根 CA 证书创建 Knox 证书,使用 CER001 创建 - 生成根 CA 证书CER003 - 上传现有的根 CA 证书
CER032 - 使用生成的 CA 对 App-Proxy 证书进行签名 此笔记本使用生成根 CA 证书签署通过 CER022 - 创建应用代理证书 创建的证书,该根 CA 证书由 CER001 - 生成根 CA 证书CER003 - 上传现有的根 CA 证书 创建。
CER033 - 使用生成的 CA 对 Master 证书进行签名 此笔记本通过使用CER023 - 创建主证书生成的主证书,对根CA证书进行签名,该证书是通过使用CER001 - 生成根CA证书或者CER003 - 上传现有的根CA证书生成的。
CER034 - 使用生成的 CA 对控制器证书进行签名 此笔记本通过使用生成的根 CA 证书对使用 CER024 - 创建控制器证书 创建的证书进行签名。该根 CA 证书是通过 CER001 - 生成根 CA 证书CER003 - 上传现有根 CA 证书 创建的。
CER040 - 安装签名的管理代理证书 此笔记本将安装到大数据群集中,该群集使用 CER030 - 使用生成的 CA 对管理代理证书进行签名
CER041 - 安装签名的 Knox 证书 此笔记本将安装到大数据集群中,并使用 CER031 - 使用生成的 CA 签署 Knox 证书
CER042 - 安装已签名的 App-Proxy 证书 此笔记本将在大数据群集中安装使用 CER032 - 使用生成的 CA 对 App-Proxy 证书进行签名 的证书。
CER043 - 安装签名的主证书 此笔记本将在大数据群集中安装使用CER033 - 使用群集根 CA 签名的主证书。请注意,在执行完此笔记本后,主节点的 Pod 将重启以加载新证书。
CER044 - 安装签名的控制器证书 此笔记本将在大数据群集中安装使用CER034 - 使用群集根 CA 对控制器证书进行签名的证书。请注意,在运行该笔记本的末尾,控制器 Pods 以及所有使用 PolyBase 的 Pods(包括主池和计算池 Pods)将被重启以加载新证书。
CER050 - 等待 BDC 恢复正常状态 在重启控制器 Pod 并使用 PolyBase 的 Pod 以加载新证书后,此笔记本将等到大数据群集恢复到正常状态。
CER100 - 使用自签名证书配置群集 此笔记本将在大数据群集中生成新的根 CA,并为每个终结点创建新证书(这些终结点为:管理、网关、应用代理和控制器)。 使用新生成的根 CA 对每个新证书进行签名,控制器证书(使用现有群集根 CA 签名)除外,然后将每个证书安装到大数据群集中。 将新生成的根 CA 下载到此计算机的受信任根证书颁发机构证书存储中。 所有生成的自签名证书都将存储在test_cert_store_root位置的控制器 Pod 中。
CER101 - 使用现有根 CA 配置具有自签名证书的群集 此笔记本将使用大数据集群中现有的生成的根 CA(通过 CER003 上传),为每个终结点(管理、网关、App-Proxy 和控制器)创建新证书。然后,用新生成的根 CA 对除控制器证书以外的每个新证书进行签名,而控制器证书将使用现有的集群根 CA 进行签名。最后,将每个证书安装到大数据集群中。 所有生成的自签名证书都将存储在控制器 Pod 中,位于 test_cert_store_root 位置。 完成此笔记本后,从这台计算机(以及安装新根 CA 的任何计算机)通过 https:// 访问大数据集群的所有连接都将显示为安全。 Notebook Runner 部分将确保创建 CronJobs(OPR003)以运行 App-Deploy,并安装群集根 CA,从而能够安全地获取 JWT 令牌和 swagger.json。
CER102 - 使用现有的大数据群集 CA 配置具有自签名证书的群集 此笔记本将使用现有的大数据群集 CA 来配置具有自签名证书的群集。 阅读笔记本了解详细信息。
CER103 - 使用外部签名证书配置集群 此笔记本旨在替换终结点证书,使用大数据群集外部生成和签名的证书。 阅读笔记本了解详细信息。

大数据群集上的静态加密实用工具

本部分包含一组笔记本,用于管理 BDC 上的静态加密。

名称 DESCRIPTION
SOP0124 - 列出用于静态数据加密的密钥 使用此笔记本列出所有 HDFS 密钥。
SOP0128 - 在大数据群集中启用 HDFS 加密区域 从 CU6 或以前的 CU6 升级到 CU8 时,使用此笔记本启用 HDFS 加密区域。 在 CU8+ 的新部署或升级到 CU9 时不需要。
SOP0125 - 删除静态加密密钥 使用此笔记本删除 HDFS 加密区域密钥。 谨慎!
SOP0126 - 用于静态加密的备份密钥 使用此笔记本备份 HDFS 加密区域密钥。
SOP0127 - 还原静态加密密钥 使用此笔记本还原 HDFS 加密区域密钥。

密码轮换

用于管理大数据群集上的密码轮换的笔记本。

名称 DESCRIPTION
PASS001 - 更新管理员域控制器密码 此笔记本假定 DSA 密码已在域控制器中更新。 使用给定参数运行此笔记本,以使用新的 DSA 密码更新大数据群集。 这将重启控制器 Pod。

后续步骤

有关 SQL Server 大数据群集的详细信息,请参阅 SQL Server 2019 大数据群集简介