정보보호론/정보보안관리

재해복구계획과 RTO (Recovery Time Objective)

retro_blue 2020. 9. 22. 12:15
반응형

■ RTO (Recovery Time Objective)

 - RTO란 정보시스템이 재해로 인하여 서비스가 중단되었을 때, 서비스를 복구하는 데 걸리는 최대 허용시간

 - 즉 RTO가 '0'이라는 의미는 정보시스템에 재해가 발생했을 때 서비스를 복구하는 데 걸리는 시간이 '0'이라는 의미로서, 재해에도 불구하고 서비스가 중단되지 않는 상황을 의미한다

 - 재해의 발생에도 불구하고 무중단서비스를 제공하기 위해서는 재해복구계획(DRP : Disaster Recovery Planning)에 의한 재해복구시스템(DRS : Disaster Recovery System)을 RTO가 '0'이 되는 수준으로 갖추어야 한다

 

 

■ 재해복구계획 (DRP : Disaster Recovery Planning)

 - 정보기술서비스에 대하여 재해가 발생하는 경우를 대비하여, 이의 빠른 복구를 통해 업무에 대한 영향을 최소화하기 위한 제반 계획을 말한다

 - 중요한 업무 프로세스에 대하여 재해가 발생할 가능성 및 재해 발생 시의 피해를 최소화하기 위한 일련의 행위 집합으로도 정의된다

 

 ☆ 재해복구계획 수립

  - 재해복구계획 수립을 위해서는 업무영향분석(BIA : Business Impact Analysis)을 통해 계획수립에 필요한 다음의 사항들을 도출ㆍ분석한 후 수립한다

 

 ☆ 주요 업무 프로세스

  - 재해 유형별 발생가능성 및 재해 영향의 지속시간

  - 재해 시 업무 프로세스의 중단에 따른 손실 정도

  - 업무 중요성 우선순위 및 복구대상 업무 범위

  - 주요 업무 프로세스별 복구 목표시간(RTO) 및 복구 목표시점(RPO : Recovery Point Objective)

 

 

■ 재해복구시스템 (DRS : Disaster Recovery System)

 

1) 재해복구시스템의 복구수준별 유형

 ⓐ 미러사이트 (Mirror Site)

   - 주 센터와 동일한 수준의 정보기술자원을 원격지에 구축하여 두고, 주 센터와 재해복구센터 모두 액티브상태로(Active-Active) 실시간에 동시 서비스하는 방식이다

   - 재해 발생 시 복구까지의 소요시간(RTO)은 즉시('0')이다

   - 초기 투자 및 유지보수에 높은 비용이 소요된다

   - 웹 애플리케이션 서비스 등 데이터의 업데이트의 빈도가 높지 않은 시스템에 적용가능하다

 

 ⓑ 핫 사이트 (Hot Site)

   - 재해복구센터에 주 센터와 동일한 수준의 시스템을 대기상태(Standby)로 원격지 사이트에 보유하면서(Active-Standby), 동기적(Synchronous) 또는 비동기적 (Asynchronous) 방식으로 실시간 복제를 통하여 최신의 데이터 상태(Up-to-date)를 유지하고 있다가, 재해 시 재해복구센터의 시스템을 활성화(Active) 상태로 전환하여 복구하는 방식이다

   - 재해 발생 시 복구까지의 소요시간(RTO)은 수시간(약 4시간 이내)이다

   - 초기투자 및 유지보수에 높은 비용이 소요된다

   - 데이터베이스 애플리케이션 등 데이터의 업데이트 빈도가 높은 시스템일 경우 재해복구센터는 대기상태(Standby)로 유지하다가 재해 시 액티브(Active)로 전환하는 방식이 일반적이다

 

 ⓒ 웜 사이트 (Worm Site)
   - Hot Site와 유사하나 메인 센터와 동일한 수준의 정보기술 자원을 보유하는 대신 중요성이 높은 기술 자원만 부분적으로 보유하는 방식으로 실시간 미러링을 수행하지 않는다

   - 실시간 미러링을 수행하지 않으며 데이터의 백업 주기가 수시간~1일 정도로 Hot Site에 비해 다소 길다

   - 재해 발생 시 복구까지의 소요시간(RTO)은 수일~수주이다

   - 재해 및 유지비용이 Mirror Site 및 Hot Site에 비해 저렴하나 초기의 복구수준이 완전하지 않으며 완전한 복구까지의 다소의 시일이 소요된다

 

 ⓓ 콜드 사이트 (Cold Site)

   - 데이터만 원격지에 보관하고 이의 서비스를 위한 정보자원은 확보하지 않거나 장소 등 최소한으로만 확보하고 있다가 재해 시에 데이터의 근간으로 필요한 정보자원을 조달하여 정보시스템의 복구를 개시하는 방식이다

   - 주 센터의 데이터는 주기적(수일~수주)으로 원격지에 백업된다 (즉 RPO가 수일~수주)

   - 재해 발생 시 복구까지의 시간(RTO)은 수주~수개월이다

   - 구축 및 유지비용이 가장 저렴하나 복구 소요시간이 매우 길고 복구의 신뢰성이 낮다

 

 

2) 복구수준별 유형 비교

유형 설명 RTO (Recovery Time Objective) 장점 단점
MIrror Site - 주 센터와 동일한 수준의 보조 기술 자원을 원격지에 구축, Active-Active 상태로 실시간 동시서비스 제공 즉시 ('0')0 - 데이터 최신성
- 높은 안정성
- 신속한 업무재개성
- 높은 초기투자 비용
- 높은 유지보수 비용
- 데이터의 업데이트가 많은 경우에는 과부하를 초래
Hot Site - 주 센터와 동일한 수준의 정보기술 자원을 원격지에 구축하여 Standby 상태로 유지
- 주 센터 재해 시 원격지시스템을 Active 상태로 전환하여 서비스 제공
- 데이터는 동기적 또는 비동기적 방식의 실시간 미러링을 통하여 최신 상태를 유지
수시간(4시간) 이내 - 높은 안정성
- 신속한 업무재개
- 데이터의 업데이트가 많은 경우에 적합
- 높은 초기투자 비용
- 높은 유지보수 비용
Worm Site - 중요성이 높은 정보기술자원만 부분적으로 재해복구센터에 보유
- 데이터는 주기적으로(약 수시간~1일)으로 백업
수일~수주 - 구축 및 유지비용이 상대적으로 저렴 - 다소의 데이터 손실 발생
- 초기복구 수준이 부분적임
- 복구 소요시간이 비교적 긺
Cold Site - 데이터만 원격지에 보관하고 이의 서비스를 위한 정보자원은 확보하지 않거나 장소 등 최소한으로만 확보
- 재해 시 데이터를 근간으로 필요한 정보자원을 조달하여 정보시스템의 복구 개시
- 주 센터의 데이터는 주기적(수일~수주)으로 원격지에 백업
수주~수개월 - 구축 및 유지비용이 가장 저렴 - 데이터의 손실 발생
- 복구에 매우 긴 시간이 소요됨
- 복구신뢰성이 낮음

 

3) 재해복구시스템 구현 기술

 

 ① 데이터 복제방식

  ㆍ H/W적 복제 방식

     - 디스크 장치를 이용한 복제 : 자료가 최종적으로 저장되는 디스크를 복제대상으로 하여 사용 중인 원본 디스크를 원거리 지역의 복구용 디스크로 복제하는 방식        

  ㆍ S/W적 복제 방식

     - 운영체제 수준의 데이터 복제 전용 솔루션을 이용한 복제 : 데이터를 디스크에 저장, 관리하기 위하여 논리적인 볼륨을 만들어, 이 논리적 볼륨에서 데이터가 관리, 전송되어 물리적 디스크에 저장되는 방식

     - DBMS를 이용한 복제 : 주 센터의 DBMS에서 사용되는 SQL(Structured Query Language)문 혹은 변경로그를 원격사이트의 DBMS에 전송하여 복제하는 방식

 

 ② 데이터 전송 방식

  ㆍ Sync 방식 (동기 복제 방식) : 사용자 혹은 작어빙 주 센터의 운영시스템에서 데이터를 추가 혹은 변경하였을 경우 주 센터뿐 아니라 재해복구센터에서도 정상적으로 추가 혹은 변경이 완료되었다는 것을 시스템에서 확인한 후에 사용자 혹은 작업에게 추가 혹은 변경완료 신호를 보내는 방식

  ㆍ Async 방식 (비동기 복제 방식) : 데이터 복제가 기존 운영시스템의 서비스와는 별도로 디스크, 서버 및 DBMS 수준의 전송 방식에 따라 독립적으로 동작되는 방식으로, Sync 방식과 달리 기존 운영서비스의 성능에 거의 영향을 주지 않는다

 

 

더보기

- RTO (Recovery Time Objective)란 정보시스템이 재해로 인하여 서비스가 중단되었을 때 서비스를 복구하는 데 걸리는 최대 허용시간을 말하는 것으로, RTO가 '0'이라 함은 정보시스템이 재해에도 불구하고 서비스를 실시간으로 제공 가능하도록 설계됨을 의미한다

- 따라서 정보시스템을 설계함에 있어 RTO가 '0'이 도도록 하기 위해서는 높은 초기 구축비용이나 높은 유지보수 비용에도 불구하고 재해복구시스템을 Mirror Site로 구성함과 동시에 데이터 전송 방식도 동기복제 방식으로 구성해야 한다

 

반응형