使用 Microsoft HPC Pack 部署 Azure 节点的步骤

本主题介绍在运行 HPC Pack 的群集的“突发”方案中部署 Azure 节点的整个过程。

注释

从 HPC Pack 2008 R2 和 Service Pack 1 开始,支持添加 Azure 节点。

先决条件

在 Windows HPC 群集中部署 Azure 节点之前,请确保满足以下条件:

  • 群集和网络环境满足部署 Azure 节点的要求

  • 可以访问 Azure 订阅

  • Azure 订阅配置了你的方案所需的管理证书、云服务、存储帐户和其他 Azure 功能

有关详细信息,请参阅以下主题:

注释

如果计划部署大量 Azure 节点,则可能需要在本地群集环境和 Azure 订阅中配置其他配置。 有关详细信息,请参阅 使用 Microsoft HPC Pack 大规模部署 Azure 节点的最佳做法

步骤 1:创建 Azure 节点模板

若要创建 Azure 节点模板,请使用 HPC 群集管理器中的“创建节点模板向导”。

Azure 节点模板包含以下配置信息:

  • Azure 订阅中用于将一组 Azure 节点添加到群集的信息。 此信息最少包括 Azure 订阅 ID、Azure 管理证书的证书指纹、Azure 云服务的名称和存储帐户的名称。 有关详细信息,请参阅 了解 Microsoft HPC Pack 的 Azure 订阅信息

  • (可选)用于启用 HPC Pack 版本支持的其他 Azure 功能的设置。 有关配置这些附加设置的详细信息,请参阅 为 Microsoft HPC Pack 配置 Azure 节点模板

    注释

    如果 HPC Pack 版本支持,某些 Azure 功能(例如 Azure 虚拟网络)必须在 Azure 订阅中预配置,然后才能在 Azure 节点模板中配置它们。

  • 节点的可用性策略,即启动 Azure 节点的方式和时间(预配 Azure 角色实例)并停止(角色实例从 Azure 云服务中删除)。 有关详细信息,请参阅 了解 Azure 节点可用性策略

创建 Azure 节点模板

  1. 启动 HPC 群集管理器。

  2. “配置”中,在 导航窗格中,单击“ 节点模板”。

  3. “作 ”窗格中,单击“ 新建”。 此时会显示“创建节点模板向导”。

  4. 在“ 选择节点模板类型 ”页上,单击 “Azure 节点模板”,然后单击“ 下一步”。

  5. 在“ 指定模板名称 ”页上,键入节点模板的名称,并根据需要为其键入说明。 单击 “下一步”

  6. 在“ 提供订阅信息 ”页上,提供 Azure 订阅中用于添加节点的以下信息:

    1. “订阅 ID ”文本框中,键入或粘贴有效的 Azure 订阅帐户的 ID。

    2. “管理证书 ”文本框中,键入、粘贴或浏览到证书的指纹,其私钥位于计算机上的相应证书存储中。 然后单击“下一步”。

      注释

      • 指纹必须标识与 Azure 订阅中配置的管理证书相对应的私钥证书。
      • 如果键入或粘贴指纹,请确保删除所有空格。
      • 如果单击“ 浏览”,将显示可用的服务器身份验证证书列表,包括计算机上可能配置的证书。 在列表中选择一个名称以添加相应的指纹。
      • 如果之前配置了安装 HPC Pack 时在头节点上自动生成的证书,请单击“ 浏览 ”,然后选择“ 默认Microsoft HPC Azure 管理”。 有关使用 默认Microsoft HPC Azure 管理 证书的信息,请参阅 用于为 Azure 突发部署配置 Azure 管理证书的选项
      • 如果未在列表中看到所需的证书,或者你选择的证书有错误,请参阅 “排查证书问题”。

      重要

      如果头节点上运行的服务无法连接到 Azure,你可能会看到类似于 The remote server returned an error: (403) Forbidden下面的错误消息。 这可能表示网络防火墙的配置、头节点上的管理证书或与网络防火墙通信的代理客户端存在问题。 若要确保已正确配置 HPC Pack 以与 Azure 通信,请参阅 “使用 Microsoft HPC Pack 添加 Azure 节点的要求”。

  7. “提供服务信息 ”页上,选择下拉列表中显示的 Azure 云服务名称和存储帐户名称。 单击 “下一步”

  8. 根据安装的 HPC Pack 版本,可以在模板中配置其他 Azure 设置,例如远程桌面凭据或 Azure 虚拟网络的名称。 有关这些附加设置的详细信息,请参阅 配置用于 Microsoft HPC Pack 的 Azure 节点模板中的帮助主题。

  9. “配置 Azure 可用性策略 ”页上,选择要让 Azure 节点启动的方式(这会预配 Azure 中的角色实例)并停止(这会从 Azure 中删除角色实例):

    1. 如果要手动启动和停止节点,请选择该选项,然后单击“ 下一步”。 转到此过程的最后一步。

    2. 如果希望节点启动(并自动联机),请选中该选项,然后单击“ 配置可用性策略”。 此时会显示“ 配置 Azure 可用性策略 ”对话框。

    3. 在“ 配置 Azure 可用性策略 ”对话框中,单击并拖动鼠标以选择要启动和停止节点的天数和小时数。

    4. (可选)指定节点停止前的分钟数(节点上不会启动任何新作业)。

    5. 若要保存设置,请单击“ 确定”,然后单击“ 下一步”。

      重要

      • 在某些情况下,部署 Azure 角色实例可能需要几分钟时间,删除实例可能需要几分钟时间。
      • 如果选择了自动启动和停止节点的选项,除了希望节点可用于运行作业的时间外,还可以在节点部署的每个联机时间块中计划额外的时间。 还应避免以较短的时间间隔安排联机时间块。
  10. 若要创建节点模板,请在“ 审阅 ”页上单击“ 创建”。

编辑 Azure 节点模板

  1. 在 HPC 群集管理器的 “配置”中,在 导航窗格中,单击“ 节点模板”。

  2. 在“视图”窗格中,选择一个 Azure 节点模板。

  3. “作 ”窗格中,单击“ 编辑”。 此时会显示 “节点模板编辑器 ”对话框。

  4. 若要修改现有模板属性,可以指定模板名称和说明,或修改 连接信息 和其他选项卡上的其他设置。

  5. 若要验证 Azure 连接信息(例如云服务的名称和存储帐户),请在“ 连接信息 ”选项卡上单击“ 验证连接信息”。

  6. 编辑完模板后,单击“ 保存”。

其他注意事项

  • 若要在 Azure 节点模板中添加或验证订阅信息,必须具有 Internet 连接,并且必须正确配置 Azure 的管理证书。

  • 编辑连接信息不会影响已使用节点模板部署的 Azure 节点的连接设置。 只有稍后添加的节点使用模板中的新连接信息。

  • 编辑 Azure 节点可用性策略会更改已使用节点模板添加到 HPC 群集的节点以及稍后添加的节点的策略。 例如,可以编辑 Azure 节点模板,以便配置为根据每周计划自动启动和停止的 Azure 节点现在配置为手动启动和停止。

    注释

    在现有 Azure 节点模板中配置自动可用性策略后,该策略不会立即影响当前在 Azure 中启动(已预配)但处于脱机状态的节点。 如果在模板中配置的可用性间隔之一期间进行此更改,则处于该时间间隔内处于该状态的已脱机预配节点。 这些节点将根据策略自动停止,但只会在后续可用性间隔开始时自动启动(并联机)。

  • 根据 Azure 节点模板中可用性策略的配置和作业计划程序配置中的任务取消宽限期设置,停止 Azure 节点的确切时间,部署结束可能与联机时间块的计划结束不同。 当 HPC 任务仍在联机时间块结束附近运行时,可能会发生这种情况。 有关详细信息,请参阅 了解 Azure 节点可用性策略

  • 可以将文件包上传到模板中指定的存储帐户。 例如,你可能想要上传将在节点上运行的应用程序或服务文件。 如果执行此作,在 Azure 中部署角色实例时,包会自动安装在节点中。 有关打包文件并将其上传到存储帐户的详细信息,请参阅 hpcpack

步骤 2:将 Azure 节点添加到 Windows HPC 群集

创建 Azure 节点模板后,可以使用“添加节点向导”将节点添加到群集。

若要添加节点,请指定 Azure 节点模板和以下信息:

  • 节点数 启动节点时将在 Azure 中部署的角色实例数。 确保该数字在 Azure 订阅中角色实例的配额内。

  • 节点的大小 Azure 中可用于 HPC Pack 的辅助角色实例大小之一。 大小确定每个角色实例的 CPU 核心数、内存容量和本地文件系统大小等特征。 有关详细信息,请参阅 可在突发部署中使用的 Azure 辅助角色实例大小

    注释

    从 HPC Pack 2012 R2 Update 1 开始,HPC Pack 会自动检测,并允许选择其他受支持的辅助角色大小(如果稍后在 Azure 中引入)。

添加 Azure 节点

  1. 在 HPC 群集管理器的 “资源管理 ”(在某些版本的 HPC Pack 中称为 “节点管理 ”),在 “作 ”窗格中,单击“ 添加节点”。 此时会显示“添加节点向导”。

  2. “选择部署方法 ”页上,单击“ 添加 Azure 节点”,然后单击“ 下一步”。

  3. 在“ 指定新节点 ”页上,选择节点模板,指定节点的数量和大小,然后单击“ 下一步”。

  4. “完成添加节点向导 ”页上,单击“ 完成”。

其他注意事项

  • 若要添加 Azure 节点,还可以使用 Add-HpcNodeSet HPC PowerShell cmdlet。

  • 添加后,Azure 节点处于 “未部署 ”状态,其节点运行状况状态为 “未批准”。 在使用这些作业运行作业之前,必须启动这些作业(已预配),然后联机。 节点是手动启动并自动联机的,如节点模板中指定的。

  • 使用特定节点模板添加到群集的所有 Azure 节点定义一组将部署的节点,并在启动节点时可在 Azure 中共同管理。 这包括稍后使用同一节点模板添加的 Azure 节点。

  • 有关详细信息,请参阅 “添加 Azure 节点”。

步骤 3:启动 Azure 节点(预配)

若要在 Azure 中预配角色实例,必须启动已添加到 HPC 群集的 Azure 节点。 然后,将节点联机,以便它们可用于运行群集作业。

节点的启动和联机方式取决于在 Azure 节点模板中配置的可用性策略,如下所示:

  • 自动 节点会自动配置为在每周一个或多个间隔内处于 联机 状态。 无需执行其他作。

  • 手动 必须先启动节点,然后将其联机,使其可用于运行群集作业。

重要

从 HPC Pack 2012 R2 Update 1 开始,手动选择要在 Azure 中启动的一个或多个节点。 指定要启动的节点可以来自多个 Azure 节点部署。 在早期版本的 HPC Pack 中,只能启动使用一个节点模板部署的完整节点集。

手动启动特定的 Azure 节点(HPC Pack 2012 R2 Update 1 中引入)

  1. 资源管理 (在某些版本的 HPC Pack 中称为 节点管理 ),在 导航窗格中,单击 “节点”。

  2. “列表 ”或“ 热度地图” 视图中,选择要启动的一个或多个 Azure 节点。

  3. “作 ”窗格中,单击“ 开始”。 此时会显示“ 启动 Azure 节点 ”对话框。

  4. 在开始过程中,节点的状态将从 “未部署 ”更改为 “预配”。 如果要跟踪预配进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

  5. 节点成功启动后,节点状态将更改为 脱机

  6. 若要使节点联机,请选择处于 脱机 状态的节点,右键单击,然后单击“ 联机”

手动启动一组 Azure 节点并将其联机(HPC Pack 2012 R2 和早期版本)

  1. 资源管理 (在某些版本的 HPC Pack 中称为 节点管理 ),在 导航窗格中,单击 “节点”。

  2. “列表 ”或“ 热度地图 ”视图中,选择一个或多个节点。

  3. “作 ”窗格中,单击“ 开始”。 此时会显示“ 启动 Azure 节点 ”对话框。

  4. 如果选择了使用不同节点模板添加的节点,请选择节点模板以指定要启动的节点集。 然后单击“ 开始”。

  5. 在开始过程中,节点的状态将从 “未部署 ”更改为 “预配”。 如果要跟踪预配进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

  6. 节点成功启动后,节点状态将更改为 脱机

  7. 若要使节点联机,请选择处于 脱机 状态的节点,右键单击,然后单击“ 联机”

    注释

    从 HPC Pack 2008 R2 SP3 开始,可以让某些节点联机,并在节点从预配节点状态移动到脱机节点状态后立即开始运行作业,即使启动预配的节点组中的其他节点仍处于预配状态。 在这种情况下,整个节点组的运行状况仍显示为 “过渡”。 无需等待节点的运行状况转换为 正常

其他注意事项

  • 若要手动启动使用单个节点模板添加的 Azure 节点集,也可以使用 Start-HpcNodeSet HPC PowerShell cmdlet。

  • 从 HPC Pack 2012 R2 Update 1 开始,若要手动启动一个或多个指定的 Azure 节点,也可以使用 Start-HpcAzureNode HPC PowerShell cmdlet。

  • 启动 Azure 节点可能需要一些时间才能完成,具体取决于节点数和性能。 在此期间,预配日志不常更新。 当节点运行状况为 过渡时,可以取消节点的预配。 如果在预配一个或多个节点期间出现错误,则这些节点的状态设置为 “未知 ”,节点运行状况设置为 “未批准”。 若要确定失败的原因,请查看预配日志。 可以在门户中找到有关角色实例状态的其他信息。 还可以查看在角色实例上生成的跟踪日志文件。 有关详细信息,请参阅 使用 Microsoft HPC Pack 排查 Azure 节点的部署问题。

  • 如果配置了自动可用性策略,则仅在 Azure 中预配角色实例后,节点才能在联机时间块中运行作业。 启动(并联机)节点的计划时间不包括 Azure 预配角色实例所需的时间。

  • Azure 的订阅将按节点可用的时间以及所使用的计算和存储服务收费。 有关详细信息,请查看 Azure 订阅的条款。

  • 每次启动一组 Azure 节点时,Azure 中的 HPC Pack 会自动配置其他代理角色实例,以促进头节点和节点之间的通信。 代理角色实例的数量和大小取决于 HPC Pack 的版本。 预配节点后,HPC 群集管理器中未列出代理角色实例。 但是,实例会显示在门户中。 代理角色实例与 Azure 节点实例一起在 Azure 中产生费用。 有关详细信息,请参阅 设置 Azure 代理节点数

步骤 4:停止 Azure 节点

如果在 Azure 节点的节点模板中配置了自动可用性策略,则节点会自动脱机,并在策略中每个联机时间块结束时停止。 停止节点关闭并从 Azure 云服务中删除实例,并将节点返回到群集中 未部署 的状态。

如果为节点配置了手动可用性策略,可以随时手动停止辅助角色实例。 你可能想要执行此作,以确保不会为未使用的 Azure 资源付费。

重要

从 HPC Pack 2012 R2 开始,可以手动停止来自 Azure 的特定节点,以便在不再需要特定节点时缩减 Azure 节点。 指定要停止的节点可能来自多个 Azure 节点部署。 在早期版本的 HPC Pack 中,只能停止使用一个节点模板部署的完整节点集。

手动停止特定 Azure 节点(HPC Pack 2012 R2 中引入)

  1. 资源管理 (在某些版本的 HPC Pack 中称为 节点管理 ),在 导航窗格中,单击 “节点”。

  2. “列表 ”或“ 热度地图” 视图中,选择要停止的一个或多个 Azure 节点。

  3. “作 ”窗格中,单击“ 停止”。 此时会显示“ 停止 Azure 节点 ”对话框。

  4. 如果要取消节点上运行的作业以立即停止节点,请选择该选项。 否则,在耗尽任何正在运行的作业后,节点将正常停止。 然后单击“ 停止”。

  5. 如果要跟踪停止进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

手动停止一组 Azure 节点(HPC Pack 2012 和更早版本)

  1. 资源管理 (在某些版本的 HPC Pack 中称为 节点管理 ),在 导航窗格中,单击 “节点”。

  2. “列表 ”或 “热度地图” 视图中,选择一个或多个 Azure 节点。

  3. “作 ”窗格中,单击“ 停止”。 此时会显示“ 停止 Azure 节点 ”对话框。

  4. 如果选择了使用不同的节点模板添加的节点,请选择节点模板以指定要停止的节点集。

  5. 如果要取消节点上运行的作业以立即停止节点,请选择该选项。 否则,在耗尽任何正在运行的作业后,节点将正常停止。 然后单击“ 停止”。

  6. 如果要跟踪停止进度,请选择一个节点,然后在 “详细信息”窗格中,单击“ 预配日志 ”选项卡。

其他注意事项

  • 若要手动停止一组 Azure 节点(使用单个 Azure 节点模板部署),也可以使用 Stop-HpcNodeSet HPC PowerShell cmdlet

  • 如果要手动停止一组 Azure 节点并将其从群集中删除,可以使用 Remove 作或 Remove-HpcNodeSet HPC PowerShell cmdlet。

  • 在 Azure 中停止或删除一组节点可能需要几分钟才能完成。 在此过程中,云服务中的代理节点也会被删除。

  • 从 HPC Pack 2012 R2 开始,若要手动停止或删除指定的 Azure 节点,也可以使用 Stop-HpcAzureNodeRemove-HpcAzureNode HPC PowerShell cmdlet。

  • 应仅使用 HPC 群集管理器停止或删除 Azure 节点。 请勿使用门户或其他 Azure 工具删除角色实例。

另请参阅

使用 Microsoft HPC Pack 突发到 Azure 辅助角色实例
为 Microsoft HPC Pack 配置 Azure 节点模板