工作站节点和非托管服务器节点可以联机运行作业,并手动或自动脱机。 如果希望工作站节点和非托管服务器节点自动联机和脱机,则必须在节点模板中指定每周可用性策略。
注释
从 HPC Pack 2008 R2 和 SP3 开始,支持工作站节点和非托管服务器节点。 早期版本的 HPC Pack 2008 R2 仅支持工作站节点。
可用性策略指定一个或多个时间段,当节点可用(引入联机状态)运行群集作业时,每周都会有一个或多个时间段。 如果希望节点可用于运行作业(例如,工作日的每晚和周末全天),可以指定每周多次。 群集在每个联机时间块开始时自动使工作站节点和非托管服务器节点联机。 然后,这些节点立即可供运行已提交到群集的作业。 每次块结束时,节点会自动脱机。 (可选)当工作站节点上运行的任何作业和非托管服务器节点耗尽时,可以在联机块结束前指定时间间隔。
如果Microsoft HPC Pack 的版本支持它,还可以在模板中配置用户活动检测设置。 用户活动检测设置可确保群集仅在联机时间块期间未使用(基于键盘、鼠标或 CPU 活动)的工作站节点和非托管服务器节点上运行作业。 有关详细信息,请参阅 了解用户活动检测。
可用性策略与“任务取消宽限期”设置的交互
配置自动可用性策略后,工作站节点和非托管服务器节点在联机时间块通过后不会启动作业。 但是,如果配置了“任务取消宽限期”设置,仍在联机时间块结束时仍在运行的 HPC 任务可以继续运行一段时间。 “任务取消宽限期”群集属性允许应用程序在退出前保存状态信息并清理一段时间(默认期限为 15 秒)。 任务结束的确切时间取决于任务是否响应CTRL_BREAK事件(相当于 CTRL+BREAK 键组合)的速度和速度。 不处理事件的任务将立即退出,而处理该事件的任务可能需要只要任务取消宽限期才能正常退出。
由于任务取消宽限期始终在工作站节点和非托管服务器节点的联机时间块结束时开始,因此这些节点可能会在任务取消宽限期期间继续运行 HPC 任务(或直到任务处理CTRL_BREAK事件并停止)。 在用户恢复节点上的活动后,HPC 任务可以继续;但是,潜在重叠的时间可能较短。
注释
工作站节点上的任务取消宽限期的开头不受可用性策略中任务排空期的配置影响。
建议使用以下最佳做法,以避免在配置任务取消宽限期时无意中在工作站节点和非托管服务器节点上运行 HPC 任务:
将任务取消宽限期的值指定为尽可能小(例如,以秒为单位的值,而不是分钟)。
确保使用任务取消宽限期的工作站节点上运行的 HPC 应用程序可以快速清理并退出。 收到CTRL_BREAK事件后不久未退出的应用程序可以继续运行,只要任务取消宽限期。
如果 HPC Pack 版本支持,请在可用性策略中配置用户活动检测设置。 这些设置有助于确保 HPC 任务在工作站上以低于正常优先级运行,并在工作站上检测到用户活动后立即放弃系统。
其他注意事项
根据每周可用性策略,配置为联机和脱机的工作站节点和非托管服务器节点无法手动联机或脱机。 若要将这些节点配置为手动联机和脱机,必须为其分配不同的工作站节点模板,或者必须修改其当前工作站节点模板。
对节点模板所做的更改会影响分配模板的所有工作站节点和非托管服务器节点。
如果要为不同的工作站节点组和非托管服务器节点使用不同的可用性策略,请创建一个不同的节点模板以应用于每个组。