使用网络 ATC 部署主机网络

适用于:Windows Server 2025;Azure Local 2311.2 及更高版本

本文将指导你了解网络 ATC 的需求、最佳实践和部署。 网络 ATC 简化了 Windows Server 和 Azure 本地群集的部署和网络配置管理。 网络 ATC 为部署主机网络提供了一种基于意图的方法。 通过指定网络适配器的一个或多个意向(管理、计算或存储),可自动部署所需的配置。 有关网络 ATC 的详细信息(包括概述和定义),请参阅网络 ATC 概述

如果你有反馈或遇到任何问题,请查看要求和最佳做法部分,检查网络 ATC 事件日志,并与Microsoft支持团队合作。

先决条件

完成以下使用网络 ATC 的先决条件:

  • 群集中的所有服务器都必须针对 Windows Server 运行 Windows Server 2025 或更高版本,对于 Azure 本地环境,必须运行版本 2311.2 或更高版本。

  • 必须使用经 Windows Server 或 Azure 本地认证的物理主机。 有关经安全核心服务器认证的硬件,请参阅 Windows Server 目录。 对于 Azure 本地的已验证节点或更高,请参阅 Azure 本地目录

  • 同一网络 ATC 意向中的适配器必须是对称的(具有相同的品牌、型号、速度和配置),并且在每个群集节点上都可用。

    • 非对称适配器会导致部署任何意向都失败。 网络 ATC 将在部署意向之前自动确认群集中所有节点的适配器对称性。

    • 有关适配器对称性的详细信息,请参阅 Switch Embedded Teaming (SET)

  • 意向中指定的每个物理适配器都必须在群集中的所有节点上使用同一名称。

  • 确保每个网络适配器状态为 Up(由 PowerShell Get-NetAdapter cmdlet 验证)。

  • 每个节点必须安装以下 Windows Server 功能:

    • 网络 ATC
    • Hyper-V
    • 故障转移群集
    • 数据中心桥接

    下面是通过 PowerShell 安装所需功能的示例:

    Install-WindowsFeature -Name NetworkATC, Hyper-V, 'Failover-Clustering', 'Data-Center-Bridging' -IncludeManagementTools
    
  • 将每个适配器插入每台主机相同的 PCI 槽中。 这种做法可以简化映像系统的自动命名约定。

  • 在网络 ATC 之前配置物理网络(交换机),其中包括 VLAN、MTU 和 DCB 配置。 有关详细信息,请参阅物理网络要求

重要

在虚拟机中部署网络 ATC 可能仅用于测试和验证目的。 基于 VM 的部署需要替代默认适配器设置才能禁用 NetworkDirect 属性。 有关提交替代的详细信息,请参阅替代默认网络设置

在独立模式下部署网络 ATC 仅可用于测试和验证目的。

常见网络 ATC 命令

网络 ATC 中包含几个新的 PowerShell 命令。 运行 Get-Command -ModuleName NetworkATC cmdlet 来识别它们。 请确保以管理员身份运行 PowerShell。

Remove-NetIntent cmdlet 命令用于从本地节点或群集中移除意图。 此命令不会销毁已调用的配置。

示例用途

网络 ATC 更改的不是您部署的内容,而是您部署主机网络的方式。 你可以部署多个方案,只要 Microsoft 支持每个方案。 下面是常见部署选项的一些示例,以及所需的 PowerShell 命令。 这些并不是唯一可用的组合,但应有助于了解组合的可能性。

为简单起见,只展示每个 SET 组合的两个物理适配器,但也可以添加更多适配器。 有关详细信息,请参阅主机网络规划

完全聚合意向

对于此目的,计算、存储和管理网络在所有群集节点上进行部署和管理。

完全聚合意向

Add-NetIntent -Name ConvergedIntent -Management -Compute -Storage -AdapterName pNIC01, pNIC02

聚合计算和存储意图;单独管理意图

两种意向在群集节点之间进行管理。 管理使用 pNIC01 和 pNIC02,计算和存储使用不同的适配器。

存储和计算融合意向

Add-NetIntent -Name Mgmt -Management -AdapterName pNIC01, pNIC02
Add-NetIntent -Name Compute_Storage -Compute -Storage -AdapterName pNIC03, pNIC04

完全分解意向

对于此目的,计算、存储和管理网络均在所有群集节点的不同适配器上进行管理。

完全分解意向

Add-NetIntent -Name Mgmt -Management -AdapterName pNIC01, pNIC02
Add-NetIntent -Name Compute -Compute -AdapterName pNIC03, pNIC04
Add-NetIntent -Name Storage -Storage -AdapterName pNIC05, pNIC06

仅存储意向

对于这种意向,只会对存储进行管理。 管理和计算适配器不受网络 ATC 的管理。

仅存储意向

Add-NetIntent -Name Storage -Storage -AdapterName pNIC05, pNIC06

计算与管理意图

对于这种意向,只会对计算和管理网络进行管理,而不会管理存储。

管理和计算意图

Add-NetIntent -Name Management_Compute -Management -Compute -AdapterName pNIC01, pNIC02

多个计算(交换机)意向

对于此目的,会对多台计算交换机进行管理。

多个交换机意向

Add-NetIntent -Name Compute1 -Compute -AdapterName pNIC03, pNIC04
Add-NetIntent -Name Compute2 -Compute -AdapterName pNIC05, pNIC06

默认网络 ATC 值

本部分列出了网络 ATC 使用的一些关键默认值。

默认值

本部分介绍网络 ATC 将设置的其他默认值。

默认 VLAN

默认情况下,网络 ATC 对具有存储意向类型的适配器使用以下 VLAN。 如果适配器连接到物理交换机,物理网络上必须允许这些 VLAN。 如果适配器未连接到交换机,无需进行其他配置。

适配器意图 默认值
管理 未修改为管理适配器配置的 VLAN
存储适配器 1 711
存储适配器 2 712
存储适配器 3 713
存储适配器 4 714
存储适配器 5 715
存储适配器 6 716
存储适配器 7 717
存储适配器 8 718
将来使用 719

请考虑以下命令:

Add-NetIntent -Name MyIntent -Storage -AdapterName pNIC01, pNIC02, pNIC03, pNIC04

物理 NIC(或虚拟 NIC,如有必要)配置为分别使用 VLAN 711、712、713 和 714。

注释

使用网络 ATC 可以更改与 StorageVlans 上的 Add-NetIntent 参数一同使用的 VLAN。

自动存储 IP 寻址

网络 ATC 将自动为具有存储意向类型的适配器配置有效的 IP 地址。 网络 ATC 在群集中的所有节点上统一执行此操作,并验证所选地址是否尚未在网络上使用。

将按如下所示设置存储意向中每个节点上的每个适配器的默认 IP 地址:

适配器 IP 地址和子网 VLAN(虚拟局域网)
pNIC1 10.71.1.X 711
pNIC2 10.71.2.X 712
pNIC3 10.71.3.X 713

若要替代自动存储 IP 寻址,请创建存储替代并在创建意向时传递该替代:

$StorageOverride = New-NetIntentStorageOverrides
$StorageOverride.EnableAutomaticIPGeneration = $false
Add-NetIntent -Name MyIntent -Storage -Compute -AdapterName 'pNIC01', 'pNIC02' -StorageOverrides $StorageOverride

群集网络设置

默认情况下,网络 ATC 会配置一组群集网络功能。 下面列出了默认值:

资产 违约
启用网络命名功能 $true
启用实时迁移网络选择 $true (表示“真”或“是”)
启用虚拟机迁移性能 $true
虚拟机迁移性能选项 计算默认值:SMB、TCP 或 Compression
最大虚拟机迁移数 1
最大SMB迁移带宽(千兆位/秒) 基于设置计算默认值

默认数据中心桥接 (DCB) 配置

网络 ATC 建立以下优先级和带宽预留。 还应在物理网络上配置此配置。

政策 使用 默认优先级 默认带宽预留
集群 群集检测信号预留 7 如果适配器 <= 10 Gbps,则为 2%;如果适配器 >= 10 Gbps,则为 1%
SMB_Direct RDMA 存储流量 3 50%
违约 所有其他流量类型 0 余数

注释

使用网络 ATC 可以更改默认设置,例如默认带宽预留。 有关示例,请参阅 更新或重写网络设置

常见错误消息

使用新的事件日志时,有一些简单的故障排除方法可以识别意向部署失败。 本部分概述了遇到问题时的一些常见解决方法。 下面显示的错误来自 Get-NetIntentStatus cmdlet 的输出。

错误:AdapterBindingConflict

适配器绑定错误的屏幕截图。

场景 1:适配器实际上绑定到现有 vSwitch,后者与网络 ATC 正在部署的新 vSwitch 冲突。

解决方案:移除冲突的 vSwitch,然后执行 Set-NetIntentRetryState

场景 2:适配器绑定到组件,但该组件不一定是 vSwitch。

解决方案:禁用 vms_pp 组件(取消适配器与 vSwitch 的绑定),然后运行 Set-NetIntentRetryState。

错误:ConflictingTrafficClass

ConflictingTrafficClass 错误的屏幕截图。

出现此问题的原因是已配置流量类。 此预配置的流量类与网络 ATC 部署的流量类冲突。 例如,客户可能已经部署了一个名为 SMB 的流量类,而网络 ATC 将部署一个具有不同名称的类似流量类。

解决方案:

清除系统上的现有 DCB 配置,然后运行 Set-NetIntentRetryState


Get-NetQosTrafficClass | Remove-NetQosTrafficClass
Get-NetQosPolicy | Remove-NetQosPolicy -Confirm:$false
Get-NetQosFlowControl | Disable-NetQosFlowControl

错误:RDMANotOperational

“RDMA 未运行”错误的屏幕截图。

你可能会看到此消息:

  1. 如果网络适配器使用内置驱动程序。 不支持内置驱动程序,必须进行更新。

    解决方案:升级适配器的驱动程序。

  2. 如果在 BIOS 中禁用 SR-IOV。

    解决方案:在系统 BIOS 中为适配器启用 SR-IOV

  3. 如果在 BIOS 中禁用 RDMA

    解决方案:在系统 BIOS 中为适配器启用 RDMA

错误:InvalidIsolationID

“无效隔离 ID”错误的屏幕截图。

当 RoCE RDMA 正在使用中并且你已使用无法与该协议一起使用的值替代默认 VLAN 时,将出现此消息。 例如,RoCE RDMA 需要非零 VLAN,以便可以将优先级流控制 (PFC) 标记添加到框架中。 必须使用介于 1 - 4094 之间的 VLAN 值。 由于多种原因,网络 ATC 不会在没有管理员干预的情况下替代指定的值。 若要解决此问题,请执行下列操作:

  1. 选择 iWARP 作为 RDMA (NetworkDirect) 协议

    解决方案:如果适配器支持,网络 ATC 会自动选择 iWARP 作为其 RDMA 协议,该协议可能使用的 VLAN ID 为 0。 移除强制将 RoCE 作为所选协议的替代操作。

  2. 使用默认 VLAN

    解决方案:强烈建议使用网络 ATC 默认 VLAN

  3. 使用有效的 VLAN

    指定 VLAN 时,请使用 -StorageVLANs 参数,并指定 1 - 4094 之间以逗号分隔的值。

后续步骤