[EverRun] O/S 메시지 로그 inode 알람 반복발생 조치 방법

Symptoms
  • EVER RUN O/S 메시지 로그 에서 아래와 같은 로그 반복적 발생

node0 hb_recover: Found failcount of 1 for resource ‘influxdb-everrunagent’

node0 hb_recover: ERROR [HBR] Resource ‘influxdb-everrunagent’ has failcount but is not marked dirty.

node0 kernel: EXT4-fs error (device drbd5): ext4_lookup:1441: inode #42002: comm chown: deleted inode referenced: 41556

node0 kernel: EXT4-fs error (device drbd5): ext4_lookup:1441: inode #42002: comm chown: deleted inode referenced: 41556

Environment
  • EVER RUN Enterprise
Related Versions
  • EVER RUN Enterprise 7.5.1 이상
Cause
  • Primary Node 의 influxdb-everrunagent문제로 발생한 로그 .
Solution
  • Primary Node를 유지보수 모드로 해서 재부팅
Workaround
  • EVER RUN 관리자 페이지 접속
  • Physical Machines -> Primary Node 확인
  • Primary Node 선택 후 Work On 모드 선택 후 팝업 Yes 클릭
  • Node0 가 유지보수 모드로 변경 되며 node1 이 Primary 변경 확인후 Node 0 reboot 진행
  • Node1 서버에 접속하여 influxdb 기동 확인
  • 재부팅 완료 후 finalize 클릭하여 유지보수 모드 종료 정상화 처리
  • Priamry Node 의 OS 메시지 로그 확인하여 문제 로그가 발생 하고 있는지 모니터링