11월20일 이상민 행정안전부 장관이 정부서울종합청사에서 열린 지방행정전산서비스장애 대책본부 회의에 참석했다. ⓒ시사IN 이명익
11월20일 이상민 행정안전부 장관이 정부서울종합청사에서 열린 지방행정전산서비스장애 대책본부 회의에 참석했다. ⓒ시사IN 이명익

11월17일 금요일 오전 8시46분. 전국의 공무원이 출근해서 업무를 시작하는 시간이었다. 지방정부 공무원들은 시도·새올이라 불리는 행정정보시스템으로 민원 등을 처리한다. 이를 위해서는 ‘행정전자서명 인증서(GPKI)’ 시스템에 접속해 공무원 신원을 확인받아야 한다. 그런데 이 인증 시스템에 장애가 발생했다. 공무원들이 일을 처리할 수 없게 되면서, 온라인 민원서비스인 ‘정부24’도 이날 오후 1시쯤부터 중단됐다.

다음 날인 11월18일 토요일 오전 9시, 정부는 ‘정부24’ 서비스를 임시로 다시 열었다. 이날 오후 시도·새올 행정시스템도 재가동했다. 정부는 이틀간 현장 점검을 벌인 끝에 11월19일 일요일 오후 5시 ‘모든 서비스가 정상화됐다’고 밝혔다. 매뉴얼상으로는 이런 장애가 발생하면 2시간45분 만에 복구하도록 되어 있다. 하지만 장애가 발생한 시점부터 완전 정상화를 발표하기까지 56시간이 걸렸다.

왜 이런 일이 일어났을까? 각 공무원들이 컴퓨터를 사용해 ‘서버’에 있는 ‘시스템’에 접속하기 위해서는 ‘네트워크’를 거쳐야 한다. 여기서 서버가 ‘집’이고 시스템이 집 안 ‘인테리어’라면, 네트워크는 집으로 가는 ‘도로’라고 보면 된다. 통상 네트워크는 일곱 개의 층(Layer 1~7)으로 구성된다. 이용자의 정보를 특정 시스템으로 보내주는 분기점들이다. 숫자가 클수록 넓은 도로다.

이번 일은 바로 이 도로, 즉 네트워크에서 발생한 것으로 보인다. 장애가 발생하기 전날인 11월16일 목요일 저녁, 인증 시스템에 연결된 네트워크 장비 중 하나인 L4 스위치의 소프트웨어 업데이트가 이뤄졌다. 서비스 정상화를 알린 11월19일, 정부는 네트워크 장비인 L4 스위치가 문제를 일으켰다고 밝혔다.

그런데 의문이 생긴다. 설령 업데이트를 하다가 잘못되어도, ‘이중화’를 통해 만일의 사태에 대비한 동일한 백업(대체) 장비를 따로 준비해두게 되어 있기 때문이다. 11월23일 열린 국회 행정안전위원회 현안 질의에서는 왜 백업 장비가 작동하지 않았느냐는 질문이 나왔다. 고기동 행정안전부 차관은 이중화는 되어 있었는데, 이번의 경우 메인(주요) 장비뿐 아니라 백업 장비에서도 장애가 발생했다고 답했다. 이에 용혜인 기본소득당 의원이 “메인과 백업 장비의 업데이트를 동시에 둘 다 했느냐”라고 묻자, 고기동 차관은 “예, 같이 한 걸로 알고 있다”라고 말했다.

“보통은 메인 장비를 업데이트하고서 문제가 없는지 확인한 뒤에 백업 장비를 업데이트한다. 그렇게 하지 않고 동시에 업데이트를 하게 되면, 어떤 문제가 생겨도 똑같은 문제가 두 장비에 동시에 발생하게 된다. 2차선 도로 공사를 하는데, 두 차선 다 막아놓고 공사를 한 것과 같다. 이러면 이중화를 해놓았더라도 무력화된다. 가장 기본적인 사항이다.” 한 IT 대기업 개발자의 말이다.

그런데 정부는 중간에 말을 바꿨다. 정부는 전산망 먹통 사태 8일 만인 11월25일 브리핑을 열고, 당초 지목한 L4 스위치는 원인이 아니었다고 밝혔다. L4 스위치 소프트웨어의 업데이트가 오류를 일으켰다고 생각해서 업데이트 이전 상태로 되돌렸는데도 복구되지 않았고, L4 스위치 자체를 교체해도 느려지는 현상이 계속됐다는 것이다. 정부는 여러 테스트를 하던 중 L3 라우터라는 네트워크 장비에 전선을 꽂는 부분(포트)이 일부 불량인 것을 발견했으며, 다른 포트에 연결해 지연을 해소했다고 밝혔다. 즉 이번 먹통의 원인은 L3 라우터 포트 불량이라는 설명이다.

이런 해명에도 의구심은 여전히 남는다. 앞서의 IT 대기업 개발자는 “라우터 포트가 불량이면 속도가 느려지긴 하는데, 통신이 아예 안 될 정도는 아니다. 게다가 오래된 라우터라도 갑자기 이유 없이 망가질 가능성은 희박하다. 업데이트가 원인이란 해석이 차라리 합리적이라고 본다”라고 말했다. “L4가 L3 바로 밑에 있다. 만약 L4 소프트웨어를 업데이트하다 문제가 생기면 L3에도 L2에도 연쇄적으로 문제가 터질 수 있다. 이럴 땐 전체 시스템을 셧다운한 뒤 다시 가동해야 한다. 업데이트하고 몇 시간은 작동했으니 괜찮은 거 아니냐고 하는데, 하루 지나서 문제가 터지는 경우도 있다.”

11월19일 오후 서울 동작구 사당3동 주민센터에서 직원들이 정부 행정전산망 장애 사태 관련 복구 상황 등을 점검하며 비상근무를 하고 있다. ⓒ연합뉴스
11월19일 오후 서울 동작구 사당3동 주민센터에서 직원들이 정부 행정전산망 장애 사태 관련 복구 상황 등을 점검하며 비상근무를 하고 있다. ⓒ연합뉴스

네트워크 장비 업데이트가 아니라 서버 업데이트 문제일 가능성도 제기된다. 인증 시스템에 관련된 네트워크 장비는 행안부 소속 기관인 국가정보자원관리원(국자원)이 관할한다. 국자원은 대전과 광주, 대구에 센터를 두고 있다. 이번에 문제가 된 국자원 대전센터는 네트워크 장비의 유지·보수를 국내 중견기업 ㄷ사에 맡겼다. 해당 장비는 미국 시스코사 것이고, 국내 중견기업 ㅍ사가 공급했다. 익명을 요구한 한 업계 관계자는 “정부는 하드웨어 탓으로 몰아가는데 ‘원인의 원인’을 봐야 한다. 소프트웨어를 관리하는 서버가 정상적으로 작동했다면 해결됐을 일이라고 보고 있다”라고 주장했다. 사태의 발단이던 GPKI 인증 시스템과 서버는 또 다른 행안부 소속 기관인 지역정보개발원이 운영한다. 향후 책임 공방이 이어질 수 있다.

“메인 장비와 백업 장비 동시에 업데이트”

시스템 보안을 연구하는 김용대 카이스트 전기및전자공학부 교수는 국가 전산망과 관련된 일련의 구매가 지나치게 ‘파편화’되어 있는 게 본질일지 모른다고 지적한다. 지금은 여러 부처와 기관이 소프트웨어와 하드웨어의 구축, 유지·보수를 각각 따로따로 조달청을 통해 발주하는 식이다. 유지·보수 업무의 경우 1~2년에 한 번씩 경쟁입찰한다. 김용대 교수는 “각각의 장비 유지·보수 서비스를 따로 구매했을 때, 한 업체가 전체 구조를 다 알 수 있을까? 각기 다른 회사들이 구축한 소프트웨어·하드웨어를 여러 회사들이 제각각 유지·보수할 경우 서로 충돌을 일으킬 가능성이 높아진다. 어디서부터 어떻게 디버깅(오류 수정)해야 할지도 알기 어려워진다. 정부가 어떤 원칙을 가지고 행정 전산망을 운영하고 있는지 잘 모르겠다”라고 말했다.

정부가 고수한 원칙이 하나 있기는 하다. 예산 삭감이다. 행정정보 공동이용 시스템 유지보수 예산은 2022년 133억원에서 올해 127억원으로 줄었고, 내년 예산안에선 54억원으로 반토막 날 예정이다. 이번에 오류를 일으킨 시도 행정정보시스템은 2004년, 새올은 2006년 구축한 이래 개선이 이뤄지지 않았다. 두 시스템을 합친 ‘차세대 지방행정공통시스템’ 계획은 2019년부터 제출됐으나, 예비타당성 조사를 다섯 차례 탈락하고 현재 여섯 번째 예비타당성 조사 중이다. 이 시스템 관련 장비의 87%가 내구연한을 넘겼다.

업계에서는 ‘각 부처가 공공부문 소프트웨어·하드웨어 관련 발주 예산을 올리면 기획재정부에서 30%는 깎고 시작한다’고 알려져 있다. 보건복지부 차세대 사회보장정보시스템 개발에 다른 중견기업들과 함께 컨소시엄(연합)으로 참여한 대기업 LG CNS가 지난 5월 중도 철수를 선언했을 정도다. 개통 시 전산 오류 등으로 발주 당시보다 해야 할 일이 훨씬 늘어났지만(과업 변경), 이에 따른 비용을 복지부로부터 제대로 받지 못해 수백억 원 적자를 감당해야 한다는 이유였다. 정부는 이번 사태의 대안으로 대기업 참여를 내세우는데, 정부가 기본 예산과 기간을 보장하지 않는 한 대기업이어도 문제는 반복될 수 있다.

지난 11월17~20일 시도·새올 행정시스템과 정부24 오류 이후에도 11월22일 주민등록 시스템이 20분간 오류를 일으켰다. 11월23일에는 조달청 나라장터 전산망이 1시간가량 먹통이었다. 11월24일에는 한국조폐공사가 운영하는 모바일 신분증이 6시간40분간 작동하지 않았다. 11월29일에는 공무원들이 회계 처리 때 쓰는 행안부 지방재정관리시스템 ‘e호조’가 15분간 멈췄다. 11월 들어서만 다섯 번이다. 정부는 일련의 먹통 사태 원인은 서로 관련이 없다고 하지만, 그렇지 않다는 의심이 커지고 있다. 채효근 IT서비스산업협회 부회장은 이렇게 말했다. “정부 발표는 거미줄이 망가졌는데 어디서 그 원인을 제공했는지 모른다는 얘기다. 재난이 발생했는데 그 원인이 뭔지 모르는 것이야말로 진짜 재난 아닌가.”

기자명 전혜원 기자 다른기사 보기 woni@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다
관련 기사