목록커널 업데이트 (1)
SaevOps

🚨 긴급 보고: 네이버 클라우드 NKS 환경 nodelocaldns 장애 및 복구 과정 (feat. 2년 묵은 이슈?) 🚨최근 저희 팀에서 관리하던 네이버 클라우드 NKS(Naver Kubernetes Service) 고객사의 환경에서 심각한 장애가 발생했습니다. pod 내부에서 갑자기 CDB(Cloud DataBase) 도메인 주소를 호출하지 못하는 상황이 벌어진 것이죠. 긴급했던 당시 상황과 문제 해결을 위해 동분서주했던 과정을 상세히 기록하고, 재발 방지를 위한 권고사항까지 정리하여 공유드립니다.💥 예상치 못한 오류의 습격문제의 발단은 일부 pod에서 시작되었습니다. 처음에는 특정 App Service pod에서 이미지 배포 후 오류 로그가 확인되었고, 곧이어 다른 pod에서도 이상 증상이 감..
클라우드/Kubernetes
2025. 5. 19. 11:00