로컬 디스크 I/O fencing 으로 인한 서버 재부팅

Symptoms

  • MCCS 4.4.6 이상의 버전에서 서버의 리소스 부족시 서버 재부팅 발생 
  • 디스크 모니터링에 문제 발생 시  FencingOnSystemDeviceFault = true 옵션으로 인해 서버가 강제 재부팅됨잠금을 해 놓아도 강제 재부팅됨.

Environment

  • MCCS 4.4.6
  • MCCS 의 노드 속성  FencingOnSystemDeviceFault 옵션이 TRUE  로 활성화 되어 있음.

Solution

  • FencingOnSystemDeviceFault 옵션은 OS 의 정상 상태를 모니터링 하기 위한 옵션으로 서버 리소스 과부하 발생시 OS 비정상으로 판단. 
  • 서버 리소스 부족으로 과부하가 발생시 노드속성의 FencingOnSystemDeviceFault = false로 변경 후 운영 필요