Analytics Platform System 的警报显示在管理员主机设备和 System Center Operations Manager 中。 使用本文中的列表来确定需要调查哪些警报。
有关使用 Internet Explorer 连接到管理员主机的详细信息,请参阅使用管理员主机监视设备 (Analytics Platform System)。 有关 Operations Manager 的信息,请参阅使用 System Center Operations Manager监视设备 (Analytics Platform System)。
有关使用 Transact-SQL 获取警报信息的信息,请参阅使用系统视图 (Analytics Platform System) 监视设备。
警报类型
指示常规状态的警报名称通常不需要调查。 包含 NON-CRITICAL 的警报名称有时需要操作。 所有其他类型的警报都需要调查。
警报列表
下表按名称的字母顺序列出警报。 该列表不包含所有可能的警报。 某些警报的用词因不同供应商而略有不同。
警报名称 | 需要操作? | State | 严重性 | 描述 | 详细信息 |
---|---|---|---|---|---|
Ambari 代理的状态为“关键”。 | 是 | 已失败 | 错误 | 此 Ambari 代理资源已失败(状态:4 )或离线(状态:3 )。 或者,离线状态处于挂起(状态:130 )。 状态在组件的 hadoop_service_status 属性中报告。 |
查看头节点和数据节点上的群集资源。 |
Ambari 代理的状态为“非关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,此 Ambari 代理资源处于非关键状态: - 资源处于继承状态(状态: 0 )。- 资源处于挂起状态(状态: 128 )。- 资源处于在线挂起状态(状态: 129 )。- 资源正在执行初始化(状态: 1 )。状态在组件的 hadoop_service_status 属性中报告。 |
查看头节点和数据节点上的群集资源。 |
Ambari 代理的状态为“常规”。 | 否 | 操作性 | 信息 | Ambari 代理正常运行(状态:Running )。 状态在组件的 hadoop_service_status 属性中报告。 |
|
Ambari 代理的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定此 Ambari 代理资源的状态(状态:-1 )。 状态在组件的 hadoop_service_status 属性中报告。 |
查看头节点和数据节点上的群集资源。 |
应用程序检测信号状态为“常规”。 | 否 | 操作性 | 信息 | 成功建立与应用程序的通信。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
应用程序检测信号正在引发关键警报。 | 是 | 不可运行 | 错误 | 与应用程序的通信失败。 应用程序可能在重启过程中。 | 应用程序检测信号处于意外状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
群集故障转移事件已发生。 | 是 | 操作性 | 错误 | 主群集节点不再处于活动状态,因此被动节点已接管为主节点。 查看失败节点的 Windows 事件日志,以了解详细信息;并查看 HST01 VM 上的故障转移群集管理器。 | 发生故障转移。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器和节点的系统事件日志。 |
群集资源组的状态为“关键”。 | 是 | 已失败 | 错误 | 此群集资源组已失败,可能正在尝试重启,或者处于离线状态。 | 资源组状态已失败,需要进行故障排除。 查看 HST01 VM 上的故障转移群集管理器。 |
群集资源组的状态为“非关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,此群集资源组处于在线但非关键状态: - 资源组处于部分在线状态。 - 资源组处于挂起状态。 |
资源组未完全处于预期状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集资源组的状态为“常规”。 | 否 | 操作性 | 信息 | 此群集资源组处于在线状态。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
群集资源组的状态为“未知”。 | 是 | 已降级 | 警告 | 此群集资源组处于未知状态。 | 系统无法检索群集资源组的运行状况。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集资源的状态为“关键”。 | 是 | 已失败 | 错误 | 此群集资源已失败,可能正在尝试重启,或者处于离线状态。 | 群集资源未处于预期状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集资源的状态为“非关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,此群集资源处于非关键状态: - 资源处于继承状态。 - 资源处于挂起状态。 - 资源处于在线挂起状态。 - 资源处于离线挂起状态。 - 资源正在执行初始化。 |
群集资源未处于预期状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集资源的状态为“常规”。 | 否 | 操作性 | 信息 | 此群集资源处于在线状态。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
群集资源的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定此群集资源的状态。 | 系统无法检索群集资源的运行状况状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集共享卷的状态为“关键”。 | 是 | 已失败 | 错误 | 此群集共享卷资源已失败(状态:4 )或离线(状态:3 )。 或者,离线状态处于挂起(状态:130 )。 状态在组件的 csv_state 属性中报告。 |
查看 HST01 VM 上的故障转移群集管理器。 |
群集共享卷的状态为“非关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,此群集共享卷资源处于非关键状态: - 资源处于继承状态(状态: 0 )。 - 资源处于挂起状态(状态: 128 )。 - 资源处于在线挂起状态(状态: 129 )。 - 资源正在执行初始化(状态: 1 )。 状态在组件的 csv_state 属性中报告。 |
查看 HST01 VM 上的故障转移群集管理器。 |
群集共享卷的状态为“常规”。 | 否 | 操作性 | 信息 | 此群集共享卷资源处于在线(状态:2 )。 状态在组件的 csv_state 属性中报告。 |
|
群集共享卷的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定此群集共享卷资源的状态(状态:-1 )。 状态在组件的 csv_state 属性中报告。 |
查看 HST01 VM 上的故障转移群集管理器。 |
群集状态正常 | 否 | 操作性 | 信息 | 群集的状态为常规。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
控制器的状态为“关键”。 | 是 | 已失败 | 错误 | PERC 磁盘指示存在关键错误,或者控制器关闭电源。 | 本地 RAID 控制器存在关键错误,可能需要更换。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
控制器的状态为“非关键”。 | 是的,如果问题持续 7 个多小时或在同一节点上多次重复出现,并且不会绑定到预期的重新启动 | 已降级 | 警告 | PERC 磁盘报告了一个非关键问题,可能与电缆故障有关。 | 此事件最常指示 PowerEdge RAID 控制器以电池供电的缓存模块上的电池充电周期。 此周期可能是计划的测试周期(持续时间最长为 7 小时)。 当电池必须充电时,重新启动或电源周期后,也可能会对其进行报告。 此事件通常还指示控制器的策略暂时已从写入更改为写回,直到充电完成。 此更改对本地存储 ( tempdb ) 具有性能影响。 有关详细信息,请查看节点的 Windows 事件日志。 |
控制器的状态为“不可恢复”。 | 是 | 已失败 | 错误 | PERC 磁盘状态为“不可恢复”。 | 本地 RAID 控制器无法正常运行。 它已进入不可恢复状态,且可能需要替换。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
控制器的状态为“常规”。 | 否 | 操作性 | 信息 | PERC 磁盘正常运行。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
控制器的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定 PERC 磁盘的状态。 | 系统无法检索本地 RAID 控制器的运行状况状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
冷却设备的状态为“关键”。 | 是 | 已失败 | 警告 | 冷却设备已达到关键上限或较低阈值。 | 冷却设备可能需要更换。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
冷却设备的状态为“非关键”。 | 是 | 已降级 | 警告 | 冷却设备已达到非关键上限或更低阈值。 | 冷却设备尚未达到关键级别,但超出预期上限或较低范围。 有关详细信息,请查看节点的 Windows 事件日志。 |
冷却设备的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 冷却设备已达到不可恢复的上限或较低阈值。 | 冷却设备可能需要更换。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
冷却设备的状态为“常规”。 | 否 | 操作性 | 信息 | 冷却设备正常运行。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
冷却设备的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定冷却设备的状态。 | 系统无法检索冷却设备的状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
磁盘阵列的总体状态为“关键”。 | 是 | 已失败 | 错误 | 磁盘阵列的总体状态为“关键”。 | 此事件可能指示磁盘阵列由于驱动器故障或类似问题而不再处于活动状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
磁盘阵列的总体状态为“非关键”。 | 是 | 已降级 | 警告 | 磁盘阵列的总体状态指示存在非关键警告,但系统仍在运行。 | 磁盘阵列仍然正常运行,但此事件可能指示磁盘故障或类似问题。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
磁盘阵列的总体状态为“不可恢复”。 | 是 | 已失败 | 错误 | 磁盘阵列的总体状态为“不可恢复”。 | 磁盘阵列不再正常工作。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
磁盘阵列的总体状态为“常规”。 | 否 | 操作性 | 信息 | 磁盘阵列的总体状态为“常规”。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
磁盘阵列的总体状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定磁盘阵列的总体状态。 | 系统无法检索本地磁盘阵列的运行状况状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
外部存储阵列的状态为“关键”。 | 是 | 已失败 | 错误 | 外部存储阵列指示出现故障(供应商操作状态:6 、16 )。 供应商状态在组件的 storage_global_status 属性中报告。 值:6-Error 、16-Supporting Entity Error 。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储阵列的状态为“非关键”。 | 是 | 已降级 | 警告 | 外部存储阵列报告了非关键警告(供应商操作状态:3 、4 、5 、11 、14 、15 、17 )。 供应商状态在组件的 storage_global_status 属性中报告。 值:3-Degraded 、4-Stressed 、5-Predictive Failure 、11-In Service 、14-Aborted 、15-Dormant 、17-Completed Operation 。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储阵列的状态为“不可恢复”。 | 是 | 已失败 | 错误 | 外部存储阵列指示它已关闭且不可恢复(供应商操作状态:7 )。 供应商状态在组件的 storage_global_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储阵列的状态为“常规”。 | 否 | 操作性 | 信息 | 外部存储阵列正常工作(供应商状态:ok )。 供应商状态在组件的 storage_global_status 属性中报告。 |
|
外部存储阵列的状态为“未知”。 | 是 | 已降级 | 警告 | 无法根据供应商状态(供应商操作状态:0 、1 、18 )确定外部存储阵列的状态。 供应商状态在组件的 storage_global_status 属性中报告。 值:0-Unkown 、1-Other 、18-Power Mode 。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储阵列的状态为“不可访问”。 | 是 | 已失败 | 错误 | 外部存储阵列指示不可访问(供应商操作状态:8 、9 、10 、12 、13 )。 供应商状态在组件的 storage_global_status 属性中报告。 值:8-Starting 、9-Stopping 、10-Stopped 、12-No Contact 、13-Lost Communication 。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储的状态为“关键”。 | 是 | 已失败 | 错误 | 外部存储指示出现故障。 | 需要排除故障。 有关详细信息,请查看 Windows 事件日志和存储设备的事件日志。 |
外部存储的状态为“已降级”。 | 是 | 已降级 | 警告 | 存储系统已降级。 需要检查此存储系统的温度状态或电源状态。 此外,如果删除了存储系统的侧面板,则空气流更改可能会导致驱动器冷却不当,并影响温度状态。 供应商状态在组件的 storage_global_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
外部存储的状态为“非关键”。 | 是的,如果问题持续 7 个多小时或每隔 90 天频繁地在同一设备上重复出现 | 已降级 | 警告 | 外部存储报告了非严重警告。 | 此事件通常指示以下两个问题中的一种:磁盘失败/过渡事件,或 RAID 控制器以电池供电的缓存模块上的电池充电周期。 充电周期通常每 90 天安排一次,最长可能需要 7 小时。 在此期间,控制器的写入高速缓存策略可能暂时从写入更改为写回。 此更改可能会影响性能。 有关详细信息,请查看 Windows 事件日志和存储设备的事件日志。 |
外部存储的状态为“常规”。 | 否 | 操作性 | 信息 | 外部存储正常工作。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
外部存储的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定外部存储的状态。 | 系统无法检索服务器外部存储的运行状况状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志和存储设备的事件日志。 |
风扇设备的状态为“关键”。 | 是 | 已失败 | 警告 | 风扇设备已达到关键上限或较低阈值(供应商状态:CriticalUpper 或 CriticalLower )。 供应商状态在组件的 device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
风扇设备的状态为“非关键”。 | 是 | 已降级 | 警告 | 风扇设备已达到非关键上限或较低阈值(供应商状态:nonCriticalUpper 或 nonCriticalLower )。 供应商状态在组件的 device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
风扇设备的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 风扇设备已达到不可恢复上限或较低阈值(供应商状态:failed 、nonRecoverableUpper 或 nonRecoverableLower )。 供应商状态在组件的 device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
风扇设备的状态为“常规”。 | 否 | 操作性 | 信息 | 风扇设备正常运行(供应商状态:ok )。 供应商状态在组件的 device_status 属性中报告。 |
|
风扇设备的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定风扇设备的状态(供应商状态:other 或 unknown )。 供应商状态在组件的 device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
光纤通道主机控制器的状态为“关键”。 | 是 | 已失败 | 警告 | 光纤通道主机控制器组件可检测以下条件之一: - 主机控制器已失败,应替换(供应商状态: failed )。 - 主机控制器已关闭(供应商状态: shutdown )。 - 光纤通道连接失败(供应商状态: loopFailed )。 供应商状态在组件的 FC_device_rollup_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 如果控制器状态失败,请替换控制器。 |
光纤通道主机控制器的状态为“非关键”。 | 是 | 已降级 | 警告 | 光纤通道主机控制器报告以下条件之一: - 光纤通道连接失败(供应商状态: loopDegraded )。 - 光纤通道端口未连接,或者连接到的设备已关闭(供应商状态: notConnected )。 供应商状态在组件的 FC_device_rollup_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
光纤通道主机控制器的状态为“常规”。 | 否 | 操作性 | 信息 | 光纤通道主机控制器正常运行(供应商状态:ok )。 供应商状态在组件的 FC_device_rollup_status 属性中报告。 |
|
光纤通道主机控制器的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定光纤通道主机控制器状态,或者控制器不存在(供应商状态:other )。 供应商状态在组件的 FC_device_rollup_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
Hadoop 服务的状态为“关键”。 | 是 | 不可运行 | 错误 | 此服务处于关键状态,并且已停止工作(状态:Installed 或 Stopped )或处于要停止的过渡状态(状态:Stopping )。 状态在组件的 hadoop_service_status 属性中报告。 |
有关详细信息,请查看节点的 Windows 和 PDW 组件事件日志。 |
Hadoop 服务的状态为“非关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,此服务处于非关键状态: - 服务正在启动(状态: Starting )。 - 服务正在升级(状态: Upgrading )。 状态在组件的 hadoop_service_status 属性中报告。 |
有关详细信息,请查看节点的 Windows 和 PDW 组件事件日志。 |
Hadoop 服务的状态为“未知”。 | 是 | 已降级 | 警告 | 此服务报告了其处于未知状态。 状态在组件的 hadoop_service_status 属性中报告。 |
有关详细信息,请查看节点的 Hadoop 日志以及 Windows 和 PDW 组件事件日志。 |
内存设备的状态为“关键”。 | 是 | 已失败 | 警告 | 内存报告了一个关键问题。 | 可能需要替换 DIMM。 需要排除故障。 服务器可能仍处于活动状态,且存在一些失败的 RAM,但性能可能会受到影响。 有关详细信息,请查看节点的 Windows 事件日志。 |
内存设备的状态为“非关键”。 | 是 | 已降级 | 警告 | 内存报告非关键情况。 | 此事件可能指向即将发生的 DIMM 失败。 通常,这种情况意味着 DIMM 已出现错误,但尚未超过阈值,使其成为关键/失败状态。 服务器可能仍处于活动状态,且存在一些失败的 RAM,但性能可能会受到影响。 必须清除硬件日志才能清除错误。 有关详细信息,请查看节点的 Windows 事件日志。 |
内存设备的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 内存报告了不可恢复的问题。 | 可能需要替换 DIMM。 需要排除故障。 服务器可能仍处于活动状态,且存在一些失败的 RAM,但性能可能会受到影响。 有关详细信息,请查看节点的 Windows 事件日志 |
内存设备的状态为“常规”。 | 否 | 操作性 | 信息 | 内存正常工作。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
内存设备的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定内存的状态。 | 系统无法检索系统内存的运行状况状态。 可能需要替换 DIMM。 需要排除故障。 服务器可能仍处于活动状态,且存在一些失败的 RAM,但性能可能会受到影响。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络适配器的状态为“关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,网络适配器引发关键警报: - 适配器处于离线。 - 适配器已关闭。 - 适配器处于非值班状态。 |
网络适配器处于故障状态,且可能需要更换(这可能意味着更换母板)。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络适配器的状态为“非关键”。 | 是 | 已降级 | 警告 | 网络适配器指示存在非关键警告,但仍在运行。 性能可能会降级。 | 网络适配器存在一些错误,但不处于关键状态。 由于此状态可能会影响性能,因此需要进行故障排除。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络适配器的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 网络适配器处于不可恢复状态,因为它可能存在安装错误。 | 网络适配器处于故障状态,且可能需要更换(这可能意味着更换母板)。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络适配器的状态为“常规”。 | 否 | 操作性 | 信息 | 网络适配器处于在线并正常运行。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
网络适配器的状态为“未知”。 | 是 | 已降级 | 警告 | 由于以下原因之一,无法确定网络适配器的状态: - 网络适配器处于节能模式:待机、低功耗、警告、未知或电源周期。 - 尚未安装网络适配器。 - 网络适配器设备报告了未知状态。 - 网络适配器处于测试状态。 |
系统无法检索网络适配器的运行状况状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络连接的状态为“关键”。 | 是 | 已降级 | 警告 | 由于以下原因之一,网络连接引发关键警报: - 网络已断开连接。 - 硬件不存在。 - 硬件已禁用。 - 媒体已断开连接。 - 身份验证失败。 - 使用了无效地址。 - 需要凭据,但未提供。 |
网络适配器处于关键状态。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络连接的状态为“非关键”。 | 是 | 已降级 | 警告 | 网络报告为非关键状态。 出现这种状态的原因可能有以下几种: - 网络处于连接状态。 - 网络处于断开连接状态。 - 网络身份验证正在进行中。 |
网络适配器处于意外状态。 如果此问题仍然存在或多次发生,则需要进行故障排除。 有关详细信息,请查看节点的 Windows 事件日志。 |
网络连接的状态为“常规”。 | 否 | 操作性 | 信息 | 网络已连接并正常工作。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
网络连接配置文件位于预期的配置文件上。 | 否 | 操作性 | 信息 | 网络已连接并按预期配置文件工作。 配置文件在组件的 profile_category 属性中报告。 域配置文件是 2 ,专用配置文件为 1 。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 |
网络连接配置文件会显示在公共配置文件上。 | 是 | 已降级 | 警告 | 网络报告其位于公共配置文件中。 配置文件在组件的 profile_category 属性中报告。 公共配置文件报告为 0 。 这种情况可能会导致此节点的通信问题。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
群集中的节点的状态为“关键”。 | 是 | 已失败 | 错误 | 群集节点已关闭。 | 群集中的服务器已关闭。 查看 HST01 VM 上的故障转移群集管理器。 |
群集中的节点的状态为“非关键”。 | 是 | 已降级 | 警告 | 群集节点将引发非关键警报。 可能出现以下情况之一:节点处于暂停状态,或者节点正在加入群集。 | 节点处于意外状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
群集中的节点的状态为“常规”。 | 否 | 操作性 | 信息 | 群集节点正在运行。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
群集中的节点的状态为“未知”。 | 是 | 已降级 | 警告 | 群集节点处于未知状态。 | 系统无法检索节点的运行状况状态。 需要排除故障。 查看 HST01 VM 上的故障转移群集管理器。 |
物理磁盘的状态为“关键”。 | 是 | 已失败 | 错误 | 磁盘状态为关键(供应商状态:2-Unhealthy )。 状态在组件的 phys_disk_status 属性中报告。 属性 phys_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 操作状态值:0 -物理磁盘的操作状态为未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
|
物理磁盘的状态为“非关键”。 | 是 | 已降级 | 警告 | 磁盘状态指示存在非关键警告,但系统仍在运行。 状态在组件的 phys_disk_status 属性中报告。 属性 phys_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 操作状态值:0 -物理磁盘的操作状态为未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 |
物理磁盘的状态为“常规”。 | 否 | 操作性 | 信息 | 磁盘状态正常。 状态在组件的 phys_disk_status 属性中报告。 |
|
物理磁盘的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定磁盘状态(状态:5-Unknown )。 状态在组件的 phys_disk_status 属性中报告。 属性 phys_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 操作状态值:0 -物理磁盘的操作状态为未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 |
电源的状态为“关键”。 | 是 | 已失败 | 警告 | 电源指示存在关键错误。 | 电源可能需要更换。 需要排除故障。 电源是冗余的,因此服务器可能仍然处于活动状态。 有关详细信息,请查看节点的 Windows 事件日志。 |
电源的状态为“非关键”。 | 是 | 操作性 | 警告 | 电源报告了一个非关键问题。 | 电源报告了问题,但未处于失败状态。 此警报可能指示即将失败。 电源是冗余的,因此失败可能不会造成服务器中断。 可能需要清除硬件错误才能清除管理员主机错误。 有关详细信息,请查看节点的 Windows 事件日志。 |
电源的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 电源的状态为“不可恢复”。 | 电源可能需要更换。 需要排除故障。 电源是冗余的,因此服务器可能仍然处于活动状态。 有关详细信息,请查看节点的 Windows 事件日志。 |
电源的状态为“常规”。 | 否 | 操作性 | 信息 | 电源正常运行。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
电源的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定电源的状态。 | 系统无法检索电源的运行状况状态。 电源是冗余的,因此服务器可能仍然处于活动状态。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
处理器设备的状态为“关键”。 | 是 | 已失败 | 警告 | CPU 报告了一个关键问题。 | 可能需要替换 CPU。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
处理器设备的状态为“非关键”。 | 是 | 已降级 | 警告 | CPU 报告非关键情况。 | CPU 遇到错误,但尚未处于失败状态。 此警报可能指示即将失败。 有关详细信息,请查看节点的 Windows 事件日志。 |
处理器设备的状态为“不可恢复”。 | 是 | 已失败 | 警告 | CPU 报告了不可恢复的问题。 | 与关键状态类似,可能需要替换 CPU。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
处理器设备的状态为“常规”。 | 否 | 操作性 | 信息 | CPU 正常工作。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
处理器设备的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定 CPU 的状态。 | 系统无法检索 CPU 的运行状况状态,且需要进一步调查。 有关详细信息,请查看节点的 Windows 事件日志。 |
SAS 主机总线适配器有降级条件。 | 是 | 已降级 | 警告 | SAS 主机总线适配器报告 HBA 及其控制的所有物理驱动器的整体状况均已降级(供应商状态:degraded )。 供应商状态在组件的 hba_device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
SAS 主机总线适配器有失败条件。 | 是 | 已失败 | 警告 | SAS 主机总线适配器报告 HBA 的整体状况处于失败状态,包括其控制的所有物理驱动器。 此条件要求替换组件(供应商状态:failed )。 供应商状态在组件的 hba_device_rollup_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
SAS 主机总线适配器的状态为“常规”。 | 否 | 操作性 | 信息 | SAS 主机总线适配器正常运行(供应商状态:ok )。 供应商状态在组件的 hba_device_rollup_status 属性中报告。 |
|
SAS 主机总线适配器的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定 SAS 主机总线适配器状态(供应商状态:other )。 供应商状态在组件的 hba_device_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
SQL Server 的状态为“关键”。 | 是 | 不可运行 | 错误 | 此服务处于关键状态,并且已停止工作(状态:Stopped )或处于要停止的过渡状态(状态:StopPending )。 状态在组件的 sql_server_service_status 属性中报告。 |
有关详细信息,请查看节点的 Windows 事件日志。 |
SQL Server 的状态为“常规”。 | 否 | 操作性 | 信息 | 此服务正常运行(状态:Running )。 状态在组件的 sql_server_service_status 属性中报告。 |
|
存储机箱风扇的状态为“已降级”。 | 是 | 已降级 | 警告 | 存储机箱风扇报告其已降级(供应商状态:10 、15 )。 供应商状态在组件的 storage_fan_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱风扇的状态为“已失败”。 | 是 | 已失败 | 警告 | 存储机箱风扇报告其处于失败状态。 此状态要求替换组件(供应商状态:20 、25 )。 供应商状态在组件的 storage_fan_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱风扇的状态为“不可恢复”。 | 是 | 已失败 | 警告 | 存储机箱风扇报告其处于不可恢复状态。 此警报要求替换组件(供应商状态:30 )。 供应商状态在组件的 storage_fan_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱风扇的状态为“未知”。 | 是 | 已降级 | 错误 | 无法确定存储机箱风扇的状态(供应商状态:0-Unknown )。 供应商状态在组件的 storage_fan_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱风扇的状态为“常规”。 | 否 | 操作性 | 信息 | 存储机箱风扇正常运行(供应商状态:5 )。 供应商状态在组件的 storage_fan_status 属性中报告。 |
|
存储机箱电源的状态为“已降级”。 | 是 | 已降级 | 警告 | 存储机箱电源报告其已降级(供应商状态:10 、15 )。 供应商状态在组件的 storage_power_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱电源的状态为“已降级”。 | 是 | 已失败 | 错误 | 存储机箱电源报告其处于失败状态。 此状态要求替换组件或将电源还原到设备(供应商状态:20 、25 )。 供应商状态在组件的 storage_power_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱电源的状态为“不可恢复”。 | 是 | 已失败 | 错误 | 存储机箱电源报告其处于不可恢复状态。 此状况要求替换组件(供应商状态:30 )。 供应商状态在组件的 storage_power_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱电源的状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定存储机箱电源的状态(供应商状态:0 )。 供应商状态在组件的 storage_power_status 属性中报告。 |
查看节点的 Windows 事件日志,以了解详细信息,或联系设备制造商。 |
存储机箱电源的状态为“常规”。 | 否 | 操作性 | 信息 | 存储机箱电源正常运行(供应商状态:5 )。 供应商状态在组件的 storage_power_status 属性中报告。 |
|
存储池的状态为“关键”。 | 是 | 已失败 | 存储池状态为关键(供应商状态:2-Unhealthy )。 状态在组件的 storage_pool_status 属性中报告。 属性 storage_pool_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 | |
存储池的状态为“非关键”。 | 是 | 已降级 | 存储池状态指示存在非关键警告,但系统仍在运行(状态:1-Warning )。 状态在组件的 storage_pool_status 属性中报告。 属性 storage_pool_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 | |
存储池的状态为“常规”。 | 否 | 操作性 | 存储池状态为正常(状态:0-Healthy )。 状态在组件的 storage_pool_status 属性中报告。 |
||
存储池的状态为“未知”。 | 可选 | 操作性 | 存储池状态在此节点上处于未知状态(状态:5-Unknown )。 状态在组件的 storage_pool_status 属性中报告。 属性 storage_pool_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 当查询存储池状态的节点不是存储池的所有者时,通常会发生此问题。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 | |
温度状态为“关键”。 | 是 | 已失败 | 错误 | 温度已达到关键上限或较低阈值。 | 温度过高或过低。 继续此状态可能会损坏或大幅缩短硬件的寿命。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
温度状态为“非关键”。 | 可选 | 已降级 | 警告 | 温度已达到非关键上限或较低阈值。 | 服务器报告的温度高于或低于常规水平,但尚未达到关键状态的阈值。 超出阈值的温度会缩短硬件寿命。 可能影响温度的事情包括工作负载、数据中心温度/空气流以及限制服务器耗尽的布线。 有关详细信息,请查看节点的 Windows 事件日志。 |
温度状态为“不可恢复”。 | 是 | 已失败 | 警告 | 温度处于不可恢复状态。 | 温度传感器已检测到无法恢复的错误。 此问题可能是温度或温度模块本身的问题。 有关详细信息,请查看节点的 Windows 事件日志。 |
温度状态为“常规”。 | 否 | 操作性 | 信息 | 温度正常。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 |
温度状态为“未知”。 | 是 | 已降级 | 警告 | 无法确定温度的状态。 | 系统无法检索服务器温度。 需要排除故障。 有关详细信息,请查看节点的 Windows 事件日志。 |
虚拟磁盘的状态为“关键”。 | 是 | 已失败 | 错误 | 存储空间虚拟磁盘状态为关键(供应商状态:2-Unhealthy )。 状态在组件的 virtual_disk_status 属性中报告。 属性 virtual_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 |
虚拟磁盘的状态为“非关键”。 | 是 | 已降级 | 警告 | 存储空间虚拟磁盘状态指示存在非关键警告,但系统仍在运行(状态:1-Warning )。 状态在组件的 virtual_disk_status 属性中报告。 属性 virtual_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 如果虚拟磁盘已移动到另一个节点,请查看群集共享卷的组件的状态,并将磁盘移回预期的所有者。 名称中 N 后面的数字指示预期的所有者。 例如,N01D01 属于 HSA01。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 单个磁盘的丢失可能会影响镜像的运行状况,因此磁盘本身可能会发生另一个警报。 |
虚拟磁盘的状态为“常规”。 | 否 | 操作性 | 信息 | 存储空间虚拟磁盘状态为常规(状态:0-Healthy )。 状态在组件的 virtual_disk_status 属性中报告。 |
|
虚拟磁盘的状态为“未知”。 | 是 | 操作性 | 警告 | 无法确定存储空间虚拟磁盘状态(状态:5-Unknown )。 状态在组件的 virtual_disk_status 属性中报告。 属性 virtual_disk_oper_status 中显示的操作状态,可能会提供有关问题的详细信息。 如果虚拟磁盘已移动到另一个节点,请查看群集共享卷的组件的状态,并将磁盘移回预期的所有者。 名称中 N 后面的数字指示预期的所有者。 例如,N01D01 属于 HSA01。 |
有关更多详细信息,请查看日志 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的节点事件。 |
卷可用空间状态为“关键”。 | 是 | 已降级 | 错误 | 卷可用空间严重不足。 当前卷的已用磁盘空间超过总容量的 90%。 清理不必要的文件/数据,以确保正常的设备操作。 | 管理员主机报告分配的空间,不一定已用空间。 可以使用 DBCC PDW_SHOWSPACEUSED 调查已使用的空间与分配的空间。 也可以使用 DBCC SHRINKLOG。 还有 DMV 可提供更多可自定义的查询以用于表大小。 有关详细信息,请参阅表大小查询。 |
卷可用空间状态为“非关键”。 | 可选 | 操作性 | 警告 | 当前卷的已用磁盘空间介于 70% 到 90% 之间。 查看此卷上使用的磁盘空间并清理不必要的文件/数据,以确保正常设备操作。 | 管理员主机报告分配的空间,不一定已用空间。 可以使用 DBCC PDW_SHOWSPACEUSED 调查已使用的空间与分配的空间。 也可以使用 DBCC SHRINKLOG。 还有 DMV 可提供更多可自定义的查询以用于表大小。 有关详细信息,请参阅表大小查询。 |
卷可用空间状态为“常规”。 | 否 | 操作性 | 信息 | 此卷上有足够的可用磁盘空间。 当前卷的已用磁盘空间低于 70%。 | 组件以前报告了不同的状态,但此后已恢复为“常规”。 若要标识表使用的空间和行,请参阅表大小查询。 |