토스, 계열사 합동 IT 재난 대응 훈련 개최
- 토스, “액티브-액티브 데이터센터 운영으로 서비스 무중단 역량갖춰”
- 원앱 위기관리 TF, 장애나 재해, 해킹 등 위협에도 대응 체계 마련
모바일 금융 플랫폼 토스 운영사 비바리퍼블리카(이하 토스)가 장애 및 재해 등 재난상황에서 위기 대응력을 높이기 위한 비상대응 훈련을 개최했다. 이번 비상대응 및 재난복구 훈련에는 토스 외에도 토스뱅크, 토스증권, 토스씨엑스 총 4개사가 함께했다.
앞서 토스-토스뱅크, 토스-토스증권 간 비상대응 훈련은 있었지만 4개 사가 합동으로 전자금융서비스망 장애 관련 비상대응 훈련을 개최한 것은 이번이 처음이다.
비상대응 시나리오는 디도스 공격으로 토스 서버의 대고객 서비스 장애, 대고객 서비스와 연계기관 서비스 장애 두 가지 경우를 가정해 대응훈련을 실시했다.
토스의 원앱 위기관리 TF 및 장애대응 TF는 각 계열사에서 총 138명이 부문별로 참여해, 상황발생 탐지 후 회의소집, 재해복구, 서비스 원복, 대외 고지 등 전 과정에 이르는 실제 프로세스를 신속하게 수행했다.
특히, 이번 훈련에서 토스 및 계열사들의 위기대응 및 재해복구 체계의 유효성을 검증하고 실전 재난 대응역량을 확인할 수 있었다.
토스는 안정적인 서비스 제공을 위해 데이터센터(IDC)를 주센터와 DR(데이터복구)센터 간 액티브-액티브 형태로 운영해 왔다. 또한, 2018년부터 IDC 이중화를 도입해 현재 수도권 내 총 3개 IDC를 운영하고 있으며 추가 1개 IDC도 오픈을 앞두고 있다.
액티브-액티브 방식은 유사 시 백업 센터를 통해 복구 과정을 거치는 액티브-스탠바이 방식에 비해 빠르게 대응 할 수 있는 것이 장점이다.
데이터센터 내 주요 전산 자원을 평소 동일하게 보유하고 있어 지진, 화재 등 비상상황 뿐 아니라 오류, 해킹 등이 발생해도 페일오버(업무 이관)을 통해 서비스 중단을 최소화할 수 있다.
앞서 토스는 금융의 슈퍼앱으로 하나의 앱 내에서 증권, 은행 등 서비스를 모두 이용할 수 있는 원앱 서비스를 제공해온 만큼 안정적인 앱 운영 역량을 꾸준히 검증해왔다. (관련 아티클: 금융 수퍼앱을 지키는 방패, 보안 엔지니어를 만나다)
장세인 토스 CISO는 “앞으로도 전자금융서비스망 장애 재난 상황을 고려한 다양한 시나리오를 개발해 정기적으로 비상대응 및 재해복구 훈련을 실시하겠다”며 “어떤 재난 상황에도 토스 사용자가 안심하고 쓸 수 있도록 위기 대응력을 제고해 나갈 것”이라고 강조했다.