쿼럼 없이 장애 조치(failover) 클러스터를 복구하는 것은 서비스를 신속하게 복원하고 쿼럼이 손실된 경우 가동 중지 시간을 최소화할 수 있기 때문에 중요한 기술입니다. 쿼럼은 분할 브레인 시나리오를 방지하고 일관된 데이터 무결성을 보장하기 때문에 장애 조치(failover) 클러스터의 적절한 작동에 필수적입니다. 쿼럼이 없으면 클러스터가 신뢰할 수 있는 결정을 내릴 수 없어 서비스 중단이 초래됩니다. 관리자는 이러한 지침에 따라 예기치 않은 문제에도 불구하고 시스템의 복원력을 향상시키고 신뢰할 수 있는 지속적인 작업을 유지할 수 있습니다.
쿼럼 투표가 충분하지 않은 클러스터는 시작되지 않습니다. 첫 번째 단계로, 항상 클러스터 쿼럼 구성을 확인하고 클러스터에 더 이상 쿼럼이 없는 이유를 조사해야 합니다. 응답이 중지된 노드가 있거나 다중 사이트 클러스터에서 기본 사이트에 연결할 수 없는 경우 이 문제가 발생할 수 있습니다. 클러스터 실패의 근본 원인을 확인한 후에는 이 섹션에 설명된 복구 단계를 사용할 수 있습니다.
비고
- 쿼럼이 손실되어 클러스터 서비스가 중지되면 시스템 로그에 이벤트 ID 1177 이 나타납니다.
- 클러스터 쿼럼이 손실된 이유를 항상 조사해야 합니다.
- 정상적으로 클러스터에 가입하여 노드 또는 쿼럼 감시를 건강한 상태로 만드는 것이 항상 바람직하며, 쿼럼 없이 클러스터를 시작하지 않는 것이 좋습니다.
필수 조건
디바이스는 모든 클러스터 노드에서 Windows Server 2012 이상을 실행해야 합니다.
장애 조치 클러스터링 기능은 각 노드에 설치되어야 합니다. 자세한 내용은 역할, 역할 서비스 또는 기능 설치 또는 제거참조하세요.
또는 다음 명령을 실행하여 장애 조치 클러스터링을 설치할 수 있습니다.
Install-WindowsFeature -Name Failover-Clustering -IncludeManagementTools
관리자 또는 도메인 관리자 그룹의 구성원이어야 합니다.
NAS(네트워크 연결 스토리지) 또는 SAN(스토리지 영역 네트워크)과 같은 클러스터의 모든 노드에서 액세스할 수 있는 공유 스토리지입니다.
클러스터 노드 강제 시작
노드 또는 쿼럼 감시를 정상 상태로 만들어 클러스터를 복구할 수 없다고 판단되면 클러스터를 강제로 시작해야 합니다. 클러스터를 강제로 시작하면 클러스터 쿼럼 구성 설정이 재정의되고 클러스터가 ForceQuorum 모드로 시작됩니다.
클러스터 노드가 쿼럼 없이 시작되도록 하려면 관리자 권한 PowerShell 창에서 다음 명령을 실행합니다.
Start-ClusterNode -ForceQuorum
쿼럼이 없을 때 클러스터를 강제로 시작하도록 하는 것은 멀티 사이트 클러스터에서 특히 유용할 수 있습니다. SiteA 및 SiteB와 같이 별도로 위치한 기본 및 백업 사이트를 포함하는 클러스터를 사용하는 재해 복구 시나리오를 고려합니다. SiteA에서 심각한 재해가 발생하면 사이트가 다시 온라인 상태가 되는 데 상당한 시간이 걸릴 수 있습니다. 쿼럼이 없더라도 SiteB 를 강제로 온라인 상태로 유지하려고 할 수 있습니다.
클러스터가 ForceQuorum 모드로 시작된 경우에는 충분한 쿼럼 응답을 다시 얻은 후 클러스터가 자동으로 강제 상태를 종료하고 정상적으로 작동합니다. 따라서 클러스터를 정상적으로 다시 시작할 필요는 없습니다. 클러스터가 노드를 잃고 쿼럼이 손실되면 더 이상 강제 상태가 아니므로 다시 오프라인 상태가 됩니다. 쿼럼이 손실된 클러스터를 복원하려면 쿼럼 없이 강제로 시작해야 합니다.
비고
- 클러스터가 강제로 시작되면 관리자는 해당 작업을 완전히 제어합니다.
- 클러스터가 특정 노드에서 강제로 시작되면 해당 노드의 구성을 사용하여 다른 모든 연결 가능한 노드에 복제합니다.
- 쿼럼 없이 클러스터를 강제로 시작하면 클러스터가 ForceQuorum 모드로 유지되는 동안 모든 쿼럼 구성 설정이 무시됩니다. 노드 투표 할당 및 동적 쿼럼 관리 설정은 장애 조치(failover) 클러스터를 효과적으로 구성하기 위한 필수 고려 사항입니다.
클러스터 노드에서 쿼럼 방지
노드에서 클러스터를 강제로 시작한 후에는 쿼럼을 방지하기 위해 설정을 사용하여 클러스터의 나머지 노드를 시작해야 합니다. 쿼럼을 방지하는 설정으로 시작된 노드는 클러스터 서비스에 새 클러스터 인스턴스를 구성하는 대신 기존의 실행 중인 클러스터에 연결하도록 지시합니다. 이는 나머지 노드에서 두 개의 경쟁 인스턴스가 포함된 분할 클러스터를 구성하는 것을 방지합니다.
백업 사이트 SiteB에서 클러스터를 강제로 시작한 후 다중 사이트 재해 복구 시나리오에서 클러스터를 복구해야 하는 경우 이 작업이 필요합니다. SiteB에서 강제로 시작된 클러스터에 연결하려면 기본 사이트 SiteA의 노드를 쿼럼이 방지된 설정으로 시작해야 합니다.
관리자 권한 창에서 장애 조치(failover) 클러스터 관리자 또는 PowerShell을 사용하여 클러스터 복구를 수행할 수 있습니다.
중요합니다
클러스터가 노드에서 강제로 시작된 후에는 쿼럼이 방지된 상태로 항상 나머지 노드를 시작하는 것이 좋습니다.
서버 관리자에서 도구를 선택하고 장애 조치 클러스터 관리자를 선택합니다.
또는시작을 선택하고 장애 조치(failover) 클러스터 관리자를 입력하고 선택합니다.
왼쪽 창에서 복구할 클러스터를 선택합니다.
클러스터를 지정하려면 작업 아래의 오른쪽 창에서 클러스터에 연결을 선택합니다. 클러스터 이름을 입력한 다음 확인을 선택합니다.
오른쪽 창의 작업 아래에서 클러스터 시작 강제 실행을 선택하고 예를 선택합니다.
클러스터 시작 강제 대신 클러스터 서비스 시작을 선택하면 쿼럼을 방지하는 설정으로 노드가 자동으로 시작됩니다.
재해 복구 구성에 대한 쿼럼 고려 사항
이 섹션에는 재해 복구 배포의 두 가지 다중 사이트 클러스터 구성에 대한 특성 및 쿼럼 구성이 요약되어 있습니다. 쿼럼 구성 지침은 사이트 간의 작업에 자동 장애 조치(failover)가 필요한지 또는 수동 장애 조치(failover)가 필요한지에 따라 다릅니다. 구성은 일반적으로 조직에 설정된 SLA(서비스 수준 계약)와 일치합니다. 이러한 SLA는 사이트 오류 또는 재해 발생 시 클러스터된 워크로드를 제공하고 지원하기 위한 기대치를 정의합니다.
이 구성에서는 클러스터가 클러스터된 역할을 호스트할 수 있는 둘 이상의 사이트로 구성됩니다. 만약 어느 사이트에서든지 장애가 발생하면 클러스터된 역할이 자동으로 다른 사이트로 장애 조치(failover)되어야 합니다. 따라서 임의의 사이트에서 완전한 사이트 장애를 감당할 수 있도록 클러스터 쿼럼을 구성해야 합니다.
다음 표에는 이 구성에 대한 고려 사항 및 권장 사항이 요약되어 있습니다.
항목 | 설명 |
---|---|
동적 쿼럼 관리 | 활성화 되어야 함 |
사이트당 노드 응답 수 | 동일해야 함 |
노드 투표 할당 | 모든 노드가 똑같이 중요하기 때문에 노드 투표를 제거하면 안 됩니다. |
감시 구성 | 파일 공유 감시가 권장되며, 클러스터 사이트와 별도의 사이트에 구성됨 |
작업 부하 | 모든 사이트에서 작업 부하를 구성할 수 있습니다. |
각 사이트에 동등한 존속 기회를 제공하려면 파일 공유 감시를 별도의 사이트에 구성해야 합니다.