DataKeeper 통신 두절로 인한 강제 온라인 로그 확인

1. Environment   

  • Windows
  • MCCS-WD(DataKeeper)

 2. Symptoms

  • error 5023 발생
  • CIM 고객사 발생 로그
    • 16/08/02-15:42:16,397 | ror_DAgent | MirrorDiskAgent: 227 | INFO | 250114:DK Connected 16/08/02-15:42:19,175 | Thread-70 | rorEventHandler: 205 | ERROR | 230022:Windows event error: File: .\Switchover.cpp Line: 1443 Switchover of mirror for volume D:\ failed. Source system 200.200.200.1 did not have a mirror in the mirroring state to this target, failed with error 5023. => dk connected 상태라고 판단. (양 노드간 ping OK, getserviceinfo OK)했으나, switchover명령이 실패함.
      => 당시 윈도우 시스템 이벤트 로그를 살펴보면, 실제 물리 네트워크 어댑터 링크가 끊어진 로그는 없음.
  • 테스트 상황
    1.양 서버가 source, target role이며, mirror state = mirror 상태, 양 서버에서 MCCS Agent는 중지 시킴.
    => 이 상황에서 미러 네트워크를 Unplug 시킴.2.target role을 가진 서버에서 emcmd . switchovervolume 명령 실행 시, 동일한 에러 5023이 발생함.C:\Program Files\MCCS\DataKeeper>emcmd . switchovervolume m Status = 5023 => 여기에서 알 수 있는 것은 실제 미러 네트워크가 끊어져 있던지, 연결은 되어 있어도 명령전달이 실패하던지 간에 
    동일한 5023 에러가 발생한다는 것입니다.

 3. Cause

  • 실제 물리네트워크는 연결된 상태였으나, 운영 중인 서버의 상태가 마우스,키보드 조작이 안되는등 문제가 있었으며
    switchover 명령은 MCCS에서 전달하였으나, OS의 어떠한 문제(마우스,키보드 조작이 안되었던 점과 관련이 있지 않나…..)로 명령이 실행되지 않았다.
    사내 테스트 결과 미러 네트워크가 끊어져 있을 때 switchover 명령을 실행하면 동일한 에러넘버 5023이 발생하는 것이 확인되었다.
    이전에 확인 요청한 3가지 사항은 모두 정상이었기 때문에 현재 의심되는 것은 당시 OS의 어떠한 문제로 인해 switchover명령이 실패한 것으로 판단된다. 

 4. Solution

  • switchover 명령 실패에 대한 케이스 오픈을 sios 측에 요청