며칠전 CJ그룹사 전산장애로 인해여 많은 불편함을 겪었다는 기사가 보도 되었습니다. 이미 언론에 보도가 되었기에 이니셜처리 하지 않겠습니다.

 

관련기사 : CJ그룹 전산장애 피해 발생

 

CJ몰, CGV, CJ푸드빌, CJ CLS, CJ대한통운 등 CJ 전 그룹사 차원의 전산장애가 발생해 소비자들이 큰 불편을 겪었다.

17일 IT 업계와 CJ그룹 관계자들에 따르면 이날 낮 12시경 CJ그룹사 홈페이지 등에 전산장애가 발생했으며 약 3시간 후인 오후 3시까지 각 사별로 순차적으로 복구됐다.

http://www.dt.co.kr/contents.html?article_no=2012071802010151739002

 

또 다른 기사 - 조금 더 구체적이네요.

 

http://www.zdnet.co.kr/news/news_view.asp?artice_id=20120717173724 

 

 

문제는 계열사만 타격이 입은 것이 아닌 그룹사 차원에서 잔산장애가 발생하였다는 것이다. 이러한 문제를 통하여 우리가 얻을수 있는 교훈은 무엇인가 살펴 본다.

 

 

 

 

 

1. 장애원인

 

언론에 보도에 따르면 아직까지 구체적인 원인 규명이 되지 않았지만 해킹이나 외부침입에 따른 것은 아니라고 하니 그 원인을 반드시 규명이 되어야 할 것입니다. 그냥 제 개인이 추측을 해 봅니다.

 

  • 휴먼에러 - 사람에 의한 실수로 시스템관리자가 실수로 명령어를 잘못 내렸다던지, 여러가지 내,외부자의 실수에 따른 장애를 말합니다.
  • 외부침입및 공격 - 외부 침입이나 공격에 따른 전산 장애를 말합니다.
  • 하드웨어와 소프트웨어 장애 - 서버나 스위치, 전원등 하드웨어적인 장애나 프로그램이 꼬인다든지 , 소스가 잘못되어 프로그램 실행이 되지 않는다든지에 따른 소프트웨어 장애 등이 있습니다.

 

2. 피해 예상은 ?

 

한 CJ 그룹사 관계자는 "점심 때부터 홈페이지에 문제가 발생해 이용자들이 예약을 하지 못해 불편을 겪어서 곤혹을 치렀다"며 "현재는 서비스가 정상화됐다"고 말했다.  -기사 본문중에서

 

 

위 상황으로 보아 긴급하게 장애가 발생하였고, 전체 그룹사에 전산장애가 생길만큼 위중한 사항이 아닌가 생각을 해봅니다. 그 상황으로 인하여 순간적인 대금 결재나 물품구매 결재중인 고객은 없었는지가 중요합니다. 전산 장애 발생후 3시간 정도후에 복구 되었다고 하니 다행이라 생각이 듭니다.

 

3. DR센터는 없었을까?

 

대기업의 경우 대부분 DR(Disaster Recovery )센터를 보유하고 있습니다. 없다면 만들어야 합니다. 재해복구센터라 함은 그룹사 전산망이 장애가 생겼을때 업무지속가능할 수 있도록 재해 복구센터를 따로 두게 되는 것입니다. 재해복구센터는 웜사이트, 쿨사이트등 여러가지 방식으로 구성이 되는데 웜사이트로 운영하는 경우 원래 센터와 똑 같은 센터를 하나더 운영하는 것이기에 그만큼 비용이 많이 들어가겠지요. 이런 점에서 이번 CJ그룹사의 경우 DR센터는 어떻게 운영 되었을까 하는 궁금증이 생깁니다.

 

4. 관리체계에 따른 모의 훈련은 있었을까?

 

정보통신망법 개정에 따라 (8.18일 ) 기업정보보호는 내년 2월18일에 기존의 안전진단 제도가 폐지가 되고 정보보호관리체계(ISMS)를 의무적으로 받아야 합니다. 물론 해당 의무 대상자로 말이지요. 그런 가운데 관리체계 인증심사시에 유의하여 보는 것 가운데 하나가 바로 시나리오베이스의 가상 모의훈련입니다. 이번 그룹사 장애로 인하여 평소 가상 모의 훈련이 체계적으로 이루어 졌을까 ?  그 가상 시나리오에 만약 그룹사 전산장애가 생기면 어떻게 하면 되는지에 대한 체계적인 매뉴얼이 있을까 라는 의문도 생깁니다.

 

5. 정전이 되었다면 UPS는 제대로 동작을 했을까?

 

그룹사 전산망이 장애가 생길경우에는 세세한 서버 한대한대에 문제가 생기는 경우는 드물게 됩니다. 보통 스위치나 라우터 혹은 UPS등에 장애가 생기는 경우가 많습니다. 위 기사에 따르면 정전에 대한 의문도 제기를 했는데요..그렇다면 UPS는 제대로 동작을 했을까요?

 

 

 

결론

 

계열사 한곳에 전산 장애라 하더라도 심각한데 그룹사 전산장애는 기업의 신뢰도를 떨어뜨리고 모든 전산 시스템이 멈추어 버려 업무가 마비가 되는 사태는 실로 커다란 장애가 아닐수 없습니다. 비록 3시간안에 모두 복구가 되었더고는 하지만 빠르게 처리해야 할 업무는 늦어질수 밖에 없고 전산처리를 통한 그 다음 과정은 진행이 되지 않을때 많은 혼란을 가져 오게 됩니다. 이러한 부분들은 평소 체계적인 관리를 통하여 유사시 긴급 대응할 수 있는 모의 훈련을 많이 해야 할 것입니다.. 아무튼 관계자분들은 이런 장애 한껀씩 터지면 많이 위축이 되고 힘들어 합니다. 이러한 사건사고를 통하여 타산지석으로 삼아 자사의 IDC에서는 동일한 장애가 생기지 않도록 분석해 보고 철저한 대비를 하는 것이 중요합니다. 아무튼 원인이 무엇인지 빨리 밝혀지고 같은 전산망 장애가 일어나지 않도록 해야 할 것입니다.

@엔시스.

 

 

 

 

Posted by 엔시스