과학기술정보통신부(이하 과기정통부)가 이달 세 차례나 발생한 메신저 오류와 관련해 카카오에 개선안 제출을 요구했다. 서비스 장애 원인은 부족한 사전테스트였던 것으로 확인됐다.
과기정통부는 지난 21일과 23일 두 차례에 걸쳐 진행한 카카오의 통신재난관리계획 이행 여부를 점검하고 미흡사항에 대한 시정조치 요구사항을 심의·의결했다고 31일 밝혔다.
과기정통부는 카카오에 1개월 내 개선 조치계획을 수립해 제출하고, 3개월 내 시정결과를 낼 것으로 요구했다.
이달 13일 있었던 첫 장애로 6분간 카카오톡 서비스가 원활하지 않았다.
서비스를 운영하는 데이터센터 서버의 파일 업데이트 작업 중 기존 파일을 삭제하는 과정에서 오류가 발생한 것이 원인으로 파악됐다. 사전테스트를 했다면 오류에 대비할 수 있었을 것이라는 진단이다.
20일 두 번째 장애 역시 6분간 지속됐다. 이용자 약 80%가 메시지 수발신 실패를 겪었다. 네트워크 부하 분산을 위한 시스템 기능 개선 작업 중 문제가 생겼다. 개발 결과물의 테스트 환경이 실제와 달라 장애 가능성을 식별하지 못했다.
가장 긴 54분간 이어진 21일 PC용 카톡 장애는 두 번째 오류를 해결하지 않은 상태에서 데이터센터 내 다른 서버의 자바 프로그램의 업데이트를 진행한 것이 화근이 됐다. 오류를 미해결한 상황에서 통제 없이 새로운 작업을 했던 것으로 알려졌다.
과기정통부는 사전테스트 범위 등 구체적인 내부 지침을 보완하고, 테스트 환경을 실제와 유사하게 구성하도록 지시했다. 또 작업 관리 프로세스를 정립해 체계를 잡을 것을 요구했다.
이종호 과기정통부 장관은 "국민 생활에 큰 영향을 주는 디지털 서비스 장애가 다시는 반복되지 않아야 한다"며 "재발 방지를 위해 사업자의 관리 체계를 면밀히 점검하겠다"고 말했다.