Failback vs. Fail Over

Failback vs. Fail Over Failover 와 Failback 은 고가용성과 재해 복구 전략에서 중요한 이중 절차이다. 페일오버 (Failover) 는 Active-Passive/Active-Active 구성에서 장애 감지 후 트래픽 전환을 수행하며, AWS ELB, Kubernetes Pod 재배치 등에 적용된다. 페일백 (Failback) 은 데이터 동기화 검증 후 점진적 복구를 수행하며, DB 복제본 재동기화, 클라우드 리전 복구 시나리오에서 활용된다. 설계 방식에 따라 RTO(Recovery Time Objective) 와 RPO(Recovery Point Objective) 에 큰 영향을 미친다. 2025 년 현재 AI 기반 자동 전환 알고리즘과 블록체인 검증 기술이 접목되는 추세이다. ...

May 18, 2025 · 15 min · Me

Availability in Numbers

Availability in Numbers “Availability in Numbers” 는 분산 시스템에서 서비스의 지속적인 접근성을 수치로 표현하고 설계하는 방법론이다. 가용성은 업타임 대 전체 운영 시간의 비율로 계산되며, 일반적으로 ‘9 의 개수 ‘(예: 99.9%, 99.999%) 로 표현된다. 이 수치는 허용 가능한 연간, 월간, 일간 다운타임을 결정하며, 시스템 설계 시 중복성 구현, 장애 감지 및 복구 메커니즘, 분산 아키텍처 패턴 등을 통해 달성된다. 가용성 설계는 시스템의 중요성, 비용, 성능 간의 균형을 고려하여 비즈니스 요구에 맞게 조정되어야 하며, 다양한 가용성 패턴을 적용해 단일 장애점을 제거하는 것이 핵심이다. ...

May 15, 2025 · 30 min · Me