配置 SQL Server 大数据群集 - 预 CU9 版本

2021-02-11

适用于：SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持，在此之前，该软件将继续通过 SQL Server 累积更新进行维护。有关详细信息，请参阅公告博客文章和 Microsoft SQL Server 平台上的大数据选项。

在 SQL Server 2019 大数据群集发布 CU8 及更早版本中，可以通过部署文件在部署 bdc.json 时配置大数据群集设置。只能使用 mssql-conf 在部署后配置 SQL Server 主实例。

注释

在 CU9 版本和支持启用配置的群集之前，大数据群集只能在部署时进行配置，但 SQL Server 主实例除外，后者只能在使用 mssql-conf 进行部署后配置。有关配置 CU9 及更高版本的说明，请参阅配置 SQL Server 大数据群集。

配置范围

大数据群集配置预 CU9 具有两个范围级别： service和 resource。设置的层次结构也遵循此顺序，从高到低。 BDC 组件将采用在最低范围内定义的设置的值。如果未在给定范围内定义设置，它将从其更高的父范围继承该值。

例如，你可能想要定义 Spark 驱动程序将在存储池和资源 Sparkhead 中使用的默认核心数。可通过两种方式实现此目的：

在 Spark 服务范围内指定默认核心值
在资源范围内指定默认核心值storage-0sparkhead

在第一个方案中，Spark 服务（存储池） Sparkhead的所有较低范围资源将从 Spark 服务默认值继承默认核心数。

在第二种情况下，每个资源将使用在其各自的范围内定义的值。

如果在服务和资源范围内配置了默认核心数，则资源范围值将替代服务范围的值，因为这是给定设置的最低 用户配置 范围。

有关配置的特定信息，请参阅相应的文章：

配置 SQL Server 主实例

配置 SQL Server 大数据群集的主实例。

部署时无法为 SQL Server 主实例配置服务器配置设置。本文介绍了如何配置 SQL Server 版本、启用或禁用 SQL Server 代理、启用特定跟踪标志或启用/禁用客户反馈等设置的临时解决方法。

若要更改这些设置中的任何一项，请执行以下步骤：

创建包括目标设置的自定义 mssql-custom.conf 文件。以下示例启用 SQL 代理、遥测、设置适用于 Enterprise Edition 的 PID，并启用跟踪标志 1204。：
```
[sqlagent]
enabled=true

[telemetry]
customerfeedback=true
userRequestedLocalAuditDirectory = /tmp/audit

[DEFAULT]
pid = Enterprise

[traceflag]
traceflag0 = 1204
```
将 mssql-custom.conf 文件复制到 /var/opt/mssql Pod 中的 mssql-server 容器中的 master-0。将 <namespaceName> 替换为大数据群集名称。
```
kubectl cp mssql-custom.conf master-0:/var/opt/mssql/mssql-custom.conf -c mssql-server -n <namespaceName>
```

重启 SQL Server 实例。将 <namespaceName> 替换为大数据群集名称。

kubectl exec -it master-0  -c mssql-server -n <namespaceName> -- /bin/bash
supervisorctl restart mssql-server
exit

重要

如果 SQL Server 主实例在可用性组配置中，请将 mssql-custom.conf 文件复制到所有 master Pod 中。请注意，每次重启都会导致故障转移，因此必须确保在停机期间安排此活动的时间。

已知的限制

以上步骤需要 Kubernetes 群集管理员权限
部署后，无法更改大数据群集的 SQL Server 主实例的服务器排序规则。

配置 Apache Spark 和 Apache Hadoop

若要在大数据群集中配置 Apache Spark 和 Apache Hadoop，需要在部署时修改群集配置文件。

大数据群集有四个配置类别：

sql
hdfs
spark
gateway

sql、hdfs、sparksql是服务。每个服务映射到同一命名的配置类别。所有网关配置都转到类别 gateway。

例如，服务 hdfs 中的所有配置都属于类别 hdfs。请注意，所有 Hadoop（核心站点）、HDFS 和 Zookeeper 配置都属于类别 hdfs;所有 Livy、Spark、Yarn、Hive、元存储配置都属于类别 spark。

支持的配置列出了可以在部署 SQL Server 大数据群集时配置的 Apache Spark 和 Hadoop 属性。

以下部分列出了 无法在 群集中修改的属性：

后续步骤

配置 SQL Server 大数据群集

通过