대기노드의 MCCS Agent 비활성화되어 failover 되지 않음

1. Environment   

  • All Windows
  • MCCS
  • MS-SQL

 2. Symptoms

  • Standby쪽으로 수동으로 switch 시키려고 했는데 Standby쪽으로 넘어가지 않음.

 3. Cause

  • MSSQLSERVER에서 SCEnterprise_log.ldf 파일 증가 delay 로그가 다수 발견
  • 실제 DB 사이즈에 비해 약 100배 증가된 상태
  • 로그 발생 시점과 미러링 Pause 시점이 일치하는 구간이 다수 확인 됨
  • 현재 핸들 수치는 전체 약 2만개로 정상인 상태라서 그 부분에 대해서는 더이상 분석이 어려우나 정상 상태에서 pause가 발생되었고 이 부분은 파일 자동 증가 문제가 주 원인임이 확실하다고 판단됨.
     event id 5144, 5145 가 발생될때마다 pause-resync 증상이 나타남

 4. Solution

  • ldf 파일 10%자동증가 증상이 자주 발생되는 이슈인데, 해당 설정을 변경하기로 함(설정에 따라 한번에 8G정도의 IO가 계속해서 발생)
  • 10% 자동증가 설정 변경 이후 정상화