'관리자실수'에 해당되는 글 1건

  1. 2010.04.12 관리자 실수와 백업의 중요성 오늘 새삼 더 느낀다. (3)

1. 들어가는 글

고객사 시스템 관리를 하다보면 가끔은 관리자 실수에 의한 커다란 재앙을 불러 오는 경우가 있다. 그것은 관리자가 몰라서 그런게 아니라 순전히 관리자의 실수이다. 

아마도 한번쯤은 모두 겪었을 것이다. 그 순간만 생각해도 아찔한 경우가 있을 것이다. 본인도 초보시절에 그러한 경험을 한 바가 있다.

우리는 이를 "휴먼에러"라고 부른다. 일부에서는 이러한 "휴먼에러 제로"에 도전하기도 한다. 그만큼 관리자의 실수가 많다는 이야기이고 그것은 치명적인 손실로 이어진다.

오늘도 어느 관리자 한분이 부랴부랴 찾아 오셨다.  리눅스 시스템을 사용하는 시스템인데 실수로 rm -rf  /  명령어를 얼떨결에 아무런 생각없이 사용하였다는 것이다. 순간 오마이갓.

흔히, 해킹을 당하면 해커가 시스템에서 이런 저런 작업을 하다가 관리자에게 들키거나 자신의 흔적을 없애려고 할때 가장 쉽고 도망치기 쉬운 것 중에 하나가 바로 "rm -rf / " 명령어를 치고 reboot 하고 도망쳐 버린다.



그런일을 관리자가 스스로 실수에 의하여 하였다는 것은 전형적인 "휴먼 에러" 인 셈이다.

결국, 이러저런 방법을 모두 동원하여 도와 주려고 하였으나 어려움이 있어 복구 업체에 맡기기로 하였다. 복구업체에서도 작업을 해 봐야 결론이 나겠다라는 답변을 들은 관리자는 아연 질색 할수 밖에 없다.

왜냐하면 백업을 받아 놓지 않았기 때문이다.  진퇴양난이다.


2. 휴먼에러 제로화를 위한 방법


우리가 이러한 "휴먼에러"를 제로화 하려면 다음과 같은 절차와 작업이 필요하다. 초보 시스템관리자나 조금 조심성이 없는 관리자들은 참고 하면 되겠다.

  • 사전에 반드시 작업 계획서를 작성한다. 작업은 작업 계획서에 따라서만 작업을 한다.
  • 가능하면 root 권한 보다는 일반 유저 권한으로 작업을 하고 필요시에만 최상위 권한을 사용한다.
  • 반드시 백업을 해 놓는다. - 이는 로컬 백업도 중요하지만 원격지 백업을 반드시 해 놓아야 한다. 이번 케이스도 원격지 백업만 받아 놓았더라도 금방 처리가 되었으리라.
  • 백업용 하드디스크를 장착한다 - 최근 하드디스크 비용이 많이 내려서 안전하게 보관해야 할 경우에는 반드시 추가 하드디스크를 장착하여 그곳에 백업 파일을 모아 놓고 정기적으로 원격지 백업을 하는 이중 삼중의 백업습관을 들여야 한다.
  • 시스템관리 규칙이나 절차 마련 - 대부분 시스템관리자나 어드민이 일정한 규칙과 절차가 없이 그냥 주먹구구식으로 생각날때 접속하여 작업을 하다보면 낭패를 당하기 쉽다. 작업시에는 반드시 규칙과 절차에 의거 하여 책임소재를 명확히 하는 규제가 필요하다.
  • 중요한 작업시에는 다시 한번 확인을 - 작업시에 중요한 확인은 다시한번 확인 하는 습관을 꼭 가지도록 하자. 조금은 성격이 덜렁대는 사람일수록 실수를 많이 하기에 다시 한번 꼭 확인하는 습관을 갖자.


3. 마무리 글

오늘도 그 관리자의 얼굴이 하얗게 창백한 얼굴을 보았고, 결국 복구업체로 가는 걸 보면서 많은 것을 느끼게 되었다. 위 대응방법중에 백업을 해 놓았다던지 아니면 조금은 신중한 작업을 했다던지 아니면 루트 권한이 아닌 일반 유져권한으로 작업을 했다던지..하는 하나의 원칙만 지켜도 그 소중한 데이터베이스는 잃어 버리지 않았을텐데 하는 마음이 들었다. 

점심까지 늦게 먹으면서 도와 드렸지만 결국 살리지 못해 미안한 감도 들었다. 밑에 직원도 안되었다고 하면서 다시금 중요한 교훈을 깨닭는 순간이었다. 복구 업체에 맡긴 만큼 비용이 들더라도 꼭 복구 되길 빌어 본다. 그리고 다시는 사용자나, 관리자 실수로 인하여 즉, 휴먼에러가 나지 않도록 작업시에는 바짝 긴장하는 마음의 자세도 중요한듯 하다.  @엔시스.



Posted by 엔시스