Home » 기록하고 기억하고 활용하자. » System Design » 분산 시스템(Distributed Systems) » Consistency Models

Strong Consistency

강한 일관성 (Strong Consistency) 은 분산 시스템에서 데이터 변경 시 모든 노드가 동시에 같은 데이터를 볼 수 있도록 보장하는 일관성 모델이다. 쓰기 작업이 완료되면 이후의 모든 읽기 작업은 즉시 최신 데이터를 반영하며, 이는 금융 시스템이나 중요한 트랜잭션에서 필수적이지만 성능과 가용성 측면에서 비용이 발생한다.

강한 일관성 (Strong Consistency)

강한 일관성은 CAP 정리의 ‘C’(일관성) 를 우선시하는 모델로, 모든 노드가 동일한 데이터를 동시에 볼 수 있도록 보장한다. 이를 위해 분산 합의 알고리즘 (Raft, Paxos), 두 단계 커밋 프로토콜, 동기식 복제 등의 기술이 사용된다. 강한 일관성은 데이터 정확성이 중요한 금융, 예약 시스템 등에 필수적이지만, 높은 지연 시간과 제한된 확장성이라는 단점이 있다. 가용성과 일관성 사이의 균형을 고려한 적절한 모델 선택이 중요하다.

핵심 개념

강한 일관성은 분산 시스템 설계에서 가장 엄격한 일관성 모델로, 다음과 같은 핵심 개념을 포함한다:

선형화 가능성 (Linearizability): 모든 작업이 마치 단일 시스템에서 발생하는 것처럼 보이도록 보장하며, 작업의 실시간 순서가 보존된다. 즉, 쓰기 작업이 완료되면 이후의 모든 읽기 작업은 즉시 그 변경사항을 볼 수 있다.
원자적 일관성 (Atomic Consistency): 모든 노드가 동일한 데이터를 동시에 볼 수 있도록 보장하며, 모든 작업이 원자적으로 실행되어 중간 상태가 노출되지 않는다.
순차적 일관성 (Sequential Consistency): 모든 노드에서 볼 수 있는 작업의 순서가 일관되며, 각 프로세스의 작업 순서는 프로그램 순서와 일치한다.
CAP 정리 (CAP Theorem): 분산 시스템에서 일관성 (Consistency), 가용성 (Availability), 분할 내성 (Partition Tolerance) 중 동시에 세 가지를 모두 만족할 수 없다는 이론이다. 강한 일관성을 선택하면 일관성과 분할 내성 (CP 시스템) 을 우선시하게 된다.
ACID 트랜잭션: 원자성 (Atomicity), 일관성 (Consistency), 격리성 (Isolation), 지속성 (Durability) 의 특성을 가진 데이터베이스 트랜잭션으로, 강한 일관성을 보장하는 데 중요한 역할을 한다.
동기식 복제 (Synchronous Replication): 주 노드에 쓰기가 수행될 때 모든 복제본이 동기적으로 업데이트되어 모든 노드가 동일한 데이터를 가지도록 보장한다.
쿼럼 기반 시스템 (Quorum-based Systems): 분산 시스템에서 노드의 과반수가 합의에 도달해야 작업이 완료되는 방식으로, 강한 일관성을 구현하는 데 사용된다.
합의 알고리즘 (Consensus Algorithms): Paxos, Raft 와 같은 알고리즘은 분산 시스템에서 노드 간의 합의를 이루어 강한 일관성을 달성하는 데 사용된다.
두 단계 커밋 프로토콜 (Two-Phase Commit Protocol): 모든 참여 노드가 커밋 단계를 완료하거나 모두 롤백하도록 보장하여 트랜잭션의 원자성을 유지한다.

목적 및 필요성

강한 일관성의 주요 목적은 분산 시스템에서 데이터의 정확성과 신뢰성을 보장하는 것이다.

이는 다음과 같은 이유로 필요하다:

데이터 무결성 보장: 모든 노드가 동일한 데이터를 볼 수 있도록 함으로써 데이터 무결성을 유지한다.
사용자 경험 향상: 시스템이 일관된 결과를 제공하여 사용자가 신뢰할 수 있는 상태를 보장한다.
예측 가능한 시스템 행동: 개발자가 시스템 동작을 더 쉽게 이해하고 예측할 수 있게 한다.
중요한 업무 지원: 금융 거래, 예약 시스템 등 데이터 일관성이 중요한 애플리케이션에 필수적이다.

주요 기능 및 역할

강한 일관성은 분산 시스템에서 다음과 같은 주요 기능과 역할을 수행한다:

즉각적인 데이터 동기화: 쓰기 작업이 완료되면 즉시 모든 노드에 반영된다.
일관된 데이터 뷰 보장: 모든 클라이언트가 동일한 시점에 동일한 데이터를 볼 수 있다.
데이터 충돌 방지: 동시에 발생하는 작업 간의 충돌을 방지하고 올바른 순서를 보장한다.
비즈니스 규칙 준수: 중요한 비즈니스 규칙이나 제약 조건이 항상 유지되도록 한다.

특징

강한 일관성의 주요 특징은 다음과 같다:

쓰기 후 읽기 일관성 (Read-Your-Writes Consistency): 쓰기 작업이 완료된 후의 모든 읽기 작업은 최신 데이터를 반영한다.
원자적 업데이트: 데이터 업데이트가 원자적으로 이루어져 중간 상태가 노출되지 않는다.
동기식 작업: 모든 노드가 동기화될 때까지 작업이 완료되지 않는다.
선형화 가능성: 모든 작업이 실행 시간에 따라 일관된 순서로 보인다.
대기 시간 증가: 합의를 위한 통신 오버헤드로 인해 작업 지연 시간이 증가할 수 있다.

핵심 원칙

강한 일관성의 핵심 원칙은 다음과 같다:

단일 시스템 이미지 (Single System Image): 분산 시스템이 마치 단일 시스템처럼 동작해야 한다.
원자성 (Atomicity): 모든 노드에 변경 사항이 적용되거나 아무 노드에도 적용되지 않아야 한다.
즉각적인 가시성 (Immediate Visibility): 쓰기 작업 후 즉시 모든 노드에서 변경 사항이 보여야 한다.
충돌 방지 (Conflict Prevention): 동시 작업 간의 충돌이 발생하지 않도록 조정해야 한다.
안전성 우선 (Safety First): 가용성보다 데이터의 안전성과 일관성을 우선시한다.

주요 원리 및 작동 원리

강한 일관성은 다음과 같은 원리로 작동한다:

동기식 복제 (Synchronous Replication): 주 노드에 데이터가 기록될 때 모든 복제본에 즉시 복사되고, 복제본으로부터 확인이 돌아온 후에야 쓰기가 커밋된다.
분산 합의 알고리즘 (Distributed Consensus Algorithms):
- Paxos: 제안자 (Proposer) 와 수락자 (Acceptor) 간의 다단계 프로토콜을 통해 값에 대한 합의를 이룬다.
- Raft: 리더 선출, 로그 복제, 안전성 보장의 세 가지 하위 문제로 분해하여 합의를 이룬다.
두 단계 커밋 프로토콜 (Two-Phase Commit Protocol):
- 1 단계 (준비 단계): 코디네이터가 모든 참가자에게 트랜잭션 커밋 준비를 요청한다.
- 2 단계 (커밋 단계): 모든 참가자가 준비되면 코디네이터가 트랜잭션 커밋을 지시한다.
쿼럼 기반 투표 (Quorum-based Voting): 노드의 과반수가 작업에 동의해야 작업이 진행된다.
로크 매커니즘 (Locking Mechanisms): 분산 락을 사용하여 여러 노드에서 동시에 같은 데이터에 접근하는 것을 방지한다.

1
2
3
4
[클라이언트] → 쓰기 → [주 노드]  
└→ 동기 복제 → [복제본 1]  
└→ 동기 복제 → [복제본 2]  
모든 복제본 승인 후 응답

구현 기법

단일 리더 복제 (Single-Leader Replication)

모든 쓰기 작업이 지정된 하나의 리더 노드를 통해서만 이루어지고, 리더가 변경사항을 팔로워에게 전파하는 방식.

구성:

하나의 리더 노드와 여러 팔로워 노드
모든 쓰기 작업은 리더로만 라우팅
동기식 복제: 리더가 팔로워들에게 변경사항을 전파하고 확인을 받은 후에 클라이언트에 응답
읽기는 리더 또는 일관성이 보장된 팔로워에서 가능

목적: 비교적 간단한 구현으로 강한 일관성 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
시스템 구성: MySQL 기반 금융 거래 시스템

시나리오:
1. 리더 노드(N1)와 팔로워 노드(N2, N3)로 구성된 클러스터
2. 클라이언트가 계좌 잔액 업데이트 요청: "계좌 A의 잔액을 1000에서 800으로 변경"
3. 요청이 리더 노드 N1으로 라우팅됨
4. N1이 로컬에서 변경 적용 후 바이너리 로그에 기록
5. N1이 N2, N3에 변경사항 전송
6. N2, N3가 변경사항 적용 후 확인 응답
7. 모든 팔로워의 확인 후 N1이 클라이언트에 성공 응답
8. 이후 어떤 노드에서 읽어도 잔액은 800으로 표시

쿼럼 기반 접근 (Quorum-based Approach)

정의: 읽기와 쓰기 작업에 정족수 (quorum) 개념을 적용하여 일관성을 보장하는 방식.

구성:

N 개의 복제본
쓰기 쿼럼 (W) 과 읽기 쿼럼 (R) 정의, W + R > N 조건 만족
쓰기 시 최소 W 개 노드의 확인 필요
읽기 시 최소 R 개 노드에서 읽고 가장 최신 값 선택

목적: 가용성과 강한 일관성 간의 균형 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
시스템 구성: 5개 노드(N=5)로 구성된 분산 Key-Value 저장소

시나리오:
1. 쓰기 쿼럼 W=3, 읽기 쿼럼 R=3으로 설정 (W+R=6 > N=5)
2. 클라이언트가 키 K의 값을 "value1"에서 "value2"로 업데이트 요청
3. 코디네이터가 모든 노드에 쓰기 요청 전송
4. 최소 3개 노드(N1, N2, N3)에서 성공 확인을 받으면 클라이언트에 성공 응답
5. 일시적으로 N4, N5는 아직 이전 값("value1") 유지 가능
6. 이후 읽기 요청 시:
   - 최소 3개 노드에서 데이터 조회
   - R=3, W=3이므로 최소 한 노드는 최신 값("value2")을 가짐
   - 버전 비교 후 최신 값("value2") 반환

2 단계 커밋 프로토콜 (Two-Phase Commit, 2PC)

분산 트랜잭션을 조정하는 원자적 커밋 프로토콜로, 준비 단계와 커밋 단계로 구성된다.

구성:

트랜잭션 코디네이터 (TC) 와 여러 참가자
1 단계 (준비): TC 가 모든 참가자에게 준비 요청, 참가자들은 작업 실행 및 로깅 후 준비 완료 응답
2 단계 (커밋/중단): 모든 참가자가 준비되면 커밋, 아니면 중단 명령

목적: 분산 환경에서 원자적 트랜잭션 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
시스템 구성: 3개의 마이크로서비스로 구성된 은행 송금 시스템

시나리오 (A 계좌에서 B 계좌로 100 이체):
1. 트랜잭션 코디네이터(TC)가 트랜잭션 시작
2. 준비 단계:
   - TC: "A 계좌에서 100 출금 준비 가능?"
   - A 서비스: 잔액 확인, 임시 출금 기록, "준비 완료" 응답
   - TC: "B 계좌에 100 입금 준비 가능?"
   - B 서비스: 임시 입금 기록, "준비 완료" 응답
3. 커밋 단계:
   - 모든 서비스가 "준비 완료"이므로, TC가 "커밋" 명령 전송
   - A 서비스: 출금 작업 확정 및 "커밋 완료" 응답
   - B 서비스: 입금 작업 확정 및 "커밋 완료" 응답
4. TC가 트랜잭션 완료 기록

3 단계 커밋 프로토콜 (Three-Phase Commit, 3PC)

2PC 의 개선 버전으로, ’ 준비 ‘, ’ 준비 완료 ‘, ’ 커밋 ’ 3 단계로 나누어 노드 장애에 더 강건한 프로토콜.

구성:

2PC 와 동일한 역할 구조
1 단계 (준비): 참가자의 준비 상태 확인
2 단계 (준비 완료): 모든 참가자가 커밋할 준비가 되었음을 알림
3 단계 (커밋): 실제 커밋 실행

목적: 2PC 의 블로킹 문제 개선 및 강한 일관성 유지

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
시스템 구성: 여러 데이터 센터에 분산된 글로벌 재고 관리 시스템

시나리오 (상품 재고 감소 및 주문 생성):
1. 코디네이터가 트랜잭션 시작
2. 준비 단계(CanCommit):
   - 코디네이터: "재고 감소 및 주문 생성 가능?"
   - 재고 서비스: 재고 확인 후 "가능" 응답
   - 주문 서비스: 주문 생성 가능성 확인 후 "가능" 응답
3. 준비 완료 단계(PreCommit):
   - 코디네이터: 모든 응답이 "가능"이므로 "준비 완료" 명령 전송
   - 재고 서비스: 재고 잠금 및 예약, 실행 로그 생성, "준비 완료" 응답
   - 주문 서비스: 주문 생성 준비, 실행 로그 생성, "준비 완료" 응답
4. 커밋 단계(DoCommit):
   - 코디네이터: "커밋 실행" 명령 전송
   - 재고 서비스: 재고 감소 확정, "커밋 완료" 응답
   - 주문 서비스: 주문 생성 확정, "커밋 완료" 응답
5. 코디네이터: 트랜잭션 완료 기록

합의 알고리즘 (Consensus Algorithms)

Paxos

비동기 네트워크에서 일련의 노드들이 하나의 값에 합의할 수 있도록 하는 알고리즘.

구성:

제안자 (Proposer), 수락자 (Acceptor), 학습자 (Learner) 역할
2 단계 프로토콜: 준비 (Prepare) 및 수락 (Accept)
다수결 원칙에 기반

목적: 분산 시스템에서 단일 값에 대한 합의 달성

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
시스템 구성: 5개의 노드로 구성된 분산 설정 서비스

시나리오 (설정값 "max_connections=500" 적용):
1. 노드 N1이 제안자 역할, 나머지는 수락자 역할
2. 준비 단계:
   - N1이 제안 번호 n=5로 준비 요청 전송
   - 수락자 N2, N3, N4가 이전에 수락한 제안이 없으므로 "준비 완료" 응답
3. 수락 단계:
   - N1이 값 "max_connections=500"과 함께 제안 번호 n=5로 수락 요청 전송
   - N2, N3, N4가 해당 값 수락 및 응답
4. 과반수 수락자가 동의했으므로 값 "max_connections=500"이 결정됨
5. 모든 학습자 노드에 결정된 값 전파

Raft

이해하기 쉬운 합의 알고리즘으로, 리더 선출, 로그 복제, 안전성으로 나눠 설계되었다.

구성:

모든 노드는 팔로워, 후보자, 리더 중 하나의 상태
리더 선출을 위한 타임아웃 및 투표 메커니즘
로그 엔트리의 일관된 복제

목적: 이해하기 쉬운 설계로 강한 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
시스템 구성: 5개 노드(N1-N5)로 구성된 etcd 클러스터

시나리오:
1. 초기 상태: 모든 노드가 팔로워 상태, 임기(term)는 0
2. 리더 선출:
   - N1의 선거 타임아웃 발생, 상태를 후보자로 변경, 임기를 1로 증가
   - N1이 자신에게 투표하고 다른 노드들에게 투표 요청
   - N2, N3, N4가 N1에 투표 (과반수 획득)
   - N1이 리더가 되어 하트비트 전송 시작
3. 로그 복제:
   - 클라이언트가 키 K의 값을 "value1"로 설정 요청
   - 리더 N1이 로그에 명령 추가 (인덱스 1, 임기 1)
   - N1이 팔로워들에게 로그 엔트리 복제 요청
   - 과반수 복제(N2, N3, N5) 확인 후 커밋
   - N1이 상태 머신에 명령 적용 후 클라이언트에 응답
   - 팔로워들도 커밋된 명령 적용

Zab (ZooKeeper Atomic Broadcast)

Apache ZooKeeper 에서 사용하는 원자적 브로드캐스트 프로토콜로, 메시지 순서를 보존하며 전달한다.

구성:

리더 선출 단계
동기화 단계: 새 리더가 팔로워들과 상태 동기화
브로드캐스트 단계: 클라이언트 요청 처리 및 복제

목적: 분산 코디네이션 서비스에서의 강한 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
시스템 구성: 3개 노드로 구성된 ZooKeeper 앙상블

시나리오:
1. 초기 상태: N1이 리더, N2, N3가 팔로워
2. 클라이언트가 znode "/config"에 값 설정 요청
3. 브로드캐스트 단계:
   - 리더 N1이 트랜잭션 ID(zxid) 5를 할당
   - N1이 팔로워들에게 제안(zxid=5, 값="/config:new_value") 전송
   - N2, N3가 제안을 로그에 기록 후 확인 응답
   - 과반수 확인 후 N1이 커밋 메시지 브로드캐스트
   - 모든 서버가 트랜잭션 적용 및 클라이언트에 응답
4. 리더 N1 장애 발생:
   - N2, N3이 리더 선출 시작
   - N3이 새 리더로 선출
   - 동기화 단계에서 N3가 마지막 커밋된 zxid 확인
   - N2와 동기화 후 새로운 요청 처리 재개

분산 락 (Distributed Locks)

여러 노드 간에 자원 접근을 조정하기 위한 동기화 메커니즘.

구성:

중앙 또는 분산 락 관리자
락 획득 프로토콜
타임아웃 및 릴리스 메커니즘
리스 (lease) 개념으로 데드락 방지

목적: 분산 환경에서 자원 접근 동기화 및 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
시스템 구성: Redis나 ZooKeeper를 락 관리자로 사용하는 마이크로서비스 아키텍처

시나리오 (사용자 프로필 업데이트):
1. 서비스 인스턴스 S1이 사용자 ID 123에 대한 락 요청
   - Redis 명령: SET user:123:lock S1_ID NX PX 10000 (10초 타임아웃)
   - 락 획득 성공
2. S1이 사용자 프로필 데이터베이스 업데이트 수행
3. 동시에 서비스 인스턴스 S2도 같은 사용자 프로필 업데이트 시도
   - 같은 락 요청 명령 실행
   - Redis가 이미 키가 존재하므로 실패 응답
   - S2는 대기하거나 나중에 재시도
4. S1이 작업 완료 후 락 해제
   - DEL user:123:lock 명령 실행
5. S2가 락 재시도하여 획득 및 작업 수행

분산 트랜잭션 (Distributed Transactions)

여러 시스템에 걸친 연산을 하나의 원자적 단위로 처리하는 메커니즘.

구성:

트랜잭션 관리자
참가자 리소스 관리자
ACID 속성 보장 메커니즘
2PC/3PC 또는 사가 (Saga) 패턴 활용

목적: 여러 시스템 간의 데이터 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
시스템 구성: 주문, 재고, 결제, 배송 서비스로 구성된 이커머스 플랫폼

시나리오 (새 주문 처리):
1. 트랜잭션 관리자가 글로벌 트랜잭션 ID 생성
2. 주문 서비스: 주문 생성 및 로컬 트랜잭션 준비
3. 재고 서비스: 재고 확인 및 할당 트랜잭션 준비
4. 결제 서비스: 결제 승인 트랜잭션 준비
5. 배송 서비스: 배송 계획 생성 트랜잭션 준비
6. 모든 서비스가 준비 완료 응답 시:
   - 트랜잭션 관리자가 각 서비스에 커밋 명령
   - 각 서비스가 로컬 트랜잭션 커밋 및 확인
7. 일부 서비스 실패 시:
   - 트랜잭션 관리자가 롤백 명령
   - 각 서비스가 로컬 트랜잭션 롤백 및 확인

동기식 복제 (Synchronous Replication)

주 복제본의 변경사항이 부 복제본들에게 전파되고 확인될 때까지 클라이언트 요청을 완료하지 않는 방식.

구성:

주 복제본과 부 복제본 구조
쓰기 작업은 주 복제본으로 라우팅
모든 (또는 쿼럼의) 부 복제본의 확인 대기
최종 확인 후 클라이언트에 응답

목적: 복제본 간의 강한 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
시스템 구성: 1개의 주 노드와 2개의 부 노드를 가진 PostgreSQL 데이터베이스

시나리오:
1. 시스템 설정: synchronous_commit = on, synchronous_standby_names = 'node2, node3'
2. 클라이언트가 중요 재무 데이터 업데이트 요청
3. 주 노드가 로컬 변경 적용 및 WAL(Write-Ahead Log) 생성
4. WAL 레코드가 node2와 node3로 전송
5. 두 부 노드가 WAL 적용 및 디스크에 기록 후 확인 응답
6. 주 노드가 두 부 노드의 확인을 받은 후 클라이언트에 성공 응답
7. 이로써 최소 3개 노드에 데이터가 안전하게 저장됨을 보장

타임스탬프 기반 조정 (Timestamp-based Coordination)

논리적 또는 물리적 타임스탬프를 사용하여 작업 순서를 결정하고 일관성을 유지하는 방식.

구성:

람포트 타임스탬프 또는 벡터 클럭 구현
각 작업에 단조 증가하는 타임스탬프 할당
타임스탬프 비교를 통한 순서 결정

목적: 분산 환경에서 이벤트 순서화 및 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
시스템 구성: Google Spanner와 유사한 글로벌 분산 데이터베이스

시나리오:
1. 시스템이 TrueTime API를 사용하여 글로벌 타임스탬프 제공
   - 각 타임스탬프는 [earliest, latest] 범위로 표현
2. 트랜잭션 T1이 시작:
   - 시작 타임스탬프: [10:00:01.000, 10:00:01.001] 할당
3. T1이 데이터 읽기 및 수정 후 커밋 준비
   - 커밋 타임스탬프: [10:00:02.000, 10:00:02.001] 할당
4. 시스템이 불확실성 대기:
   - 실제 시간이 10:00:02.001 이후가 될 때까지 대기
5. 대기 후 T1 커밋
6. 다른 트랜잭션 T2가 시작:
   - 시작 타임스탬프가 T1의 커밋 타임스탬프보다 큰 경우
   - T2는 T1의 결과를 볼 수 있음

다중 버전 동시성 제어 (Multi-Version Concurrency Control, MVCC)

데이터의 여러 버전을 유지하여 읽기 작업이 쓰기 작업을 차단하지 않도록 하는 동시에 일관성을 보장하는 기법.

구성:

각 데이터 항목의 여러 버전 유지
트랜잭션 시작 시점의 스냅샷 제공
버전 가비지 컬렉션 메커니즘

목적: 동시성과 일관성 간의 효율적인 균형 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
시스템 구성: MVCC를 구현한 PostgreSQL 데이터베이스

시나리오:
1. 트랜잭션 T1이 10:00:00에 시작:
   - 시스템이 T1에 타임스탬프 100 할당
2. T1이 레코드 R1 읽기(값: "A")
3. 트랜잭션 T2가 10:00:05에 시작:
   - 시스템이 T2에 타임스탬프 105 할당
4. T2가 R1 업데이트: "A" → "B"
   - 시스템이 R1의 새 버전 생성: (R1, "B", 105)
   - 이전 버전은 유지: (R1, "A", < 105)
5. T2가 커밋
6. T1이 다시 R1 읽기 시도:
   - T1의 타임스탬프(100)에 따라 이전 버전 (R1, "A", < 105) 반환
   - 트랜잭션 격리 보장
7. T1이 커밋
8. 새 트랜잭션 T3가 10:00:10에 시작:
   - R1 읽기 시 최신 버전 (R1, "B", 105) 반환

전체 복제 (Full Replication)

모든 노드가 전체 데이터 세트의 복사본을 유지하고, 모든 변경사항이 모든 노드에 동기적으로 적용되는 방식.

구성:

모든 노드가 완전한 데이터 사본 유지
토탈 오더 멀티캐스트 또는 상태 머신 복제
모든 업데이트를 동일한 순서로 적용

목적: 단순한 구현으로 완전한 데이터 가용성 및 강한 일관성 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
시스템 구성: 5개 노드로 구성된 소규모 클러스터 데이터베이스(예: SQLite 복제)

시나리오:
1. 클러스터가 Raft 합의 알고리즘을 사용하여 리더 선출
2. 클라이언트가 데이터 삽입 요청:
   - SQL: "INSERT INTO users VALUES (101, 'Alice', 'alice@example.com')"
3. 리더가 명령을 로그 엔트리로 변환하여 Raft 로그에 추가
4. 리더가 로그 엔트리를 모든 팔로워에게 복제
5. 과반수 복제 확인 후 리더가 커밋 지점 진행
6. 모든 노드가 커밋된 명령을 동일한 순서로 SQLite 데이터베이스에 적용
7. 리더가's 클라이언트에 성공 응답
8. 어떤 노드에 쿼리하더라도 동일한 데이터 확인 가능

선형화 가능성 (Linearizability)

가장 강력한 일관성 모델로, 모든 작업이 마치 단일 복사본에서 실행되는 것처럼 보이며 실제 시간 순서를 준수한다.

구성:

작업의 실제 시간 순서 추적
작업 간의 의존성 관리
모든 노드가 동일한 작업 순서 보장

목적: 분산 시스템에서 가장 강력한 일관성 보장 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
시스템 구성: 선형화 가능성을 보장하는 분산 키-값 저장소

시나리오:
1. 초기값: x = 0
2. 클라이언트 C1이 10:00:01에 x 읽기 → 0 반환
3. 클라이언트 C2가 10:00:02에 x = 1 쓰기
4. 클라이언트 C3가 10:00:03에 x 읽기 요청
   - 선형화 가능성에 의해 반드시 1 반환
5. 클라이언트 C1이 10:00:04에 다시 x 읽기 요청
   - 선형화 가능성에 의해 반드시 1 반환
6. 네트워크 지연이나 노드 장애가 있더라도:
   - 시스템은 C2의 쓰기가 시간상 C3의 읽기보다 앞서므로 
     C3는 반드시 1을 봐야 함
   - 이전에 0을 읽은 C1도 새 읽기에서는 반드시 1을 봐야 함

거래 메모리 (Transactional Memory)

프로그래밍 언어 수준에서 메모리 액세스를 트랜잭션으로 그룹화하여 원자성과 일관성을 보장하는 기법.

구성:

트랜잭션 경계 지정 구문
충돌 감지 및 재시도 메커니즘
낙관적 또는 비관적

목적: 멀티스레드 환경에서 프로그래밍 용이성과 강한 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
시스템 구성: 소프트웨어 거래 메모리(STM)를 구현한 분산 인메모리 데이터베이스

시나리오:
1. 다중 노드 환경에서 고객 잔액 업데이트 함수 실행:

	```java
	atomic {
	    // 트랜잭션 시작
	    Account A = accounts.get("A");
	    Account B = accounts.get("B");
	    
	    int amount = 100;
	    if (A.balance >= amount) {
	        A.balance -= amount;  // 읽기-수정-쓰기 연산
	        B.balance += amount;  // 읽기-수정-쓰기 연산
	    }
	    // 트랜잭션 종료
	}
	```

2. 동시에 다른 노드에서 같은 계정에 접근:
    - STM 시스템이 트랜잭션 로그 및 버전 기록
    - 충돌 감지: 다른 트랜잭션이 이미 변경 중인 객체 감지
    - 해결: 한 트랜잭션 커밋, 충돌 트랜잭션 자동 재시도
3. 결과적으로 계정 A와 B의 잔액 합계는 일관적으로 유지됨

증명 가능한 데이터 구조 (Verifiable Data Structures)

데이터의 무결성과 일관성을 암호학적으로 증명할 수 있는 구조.

구성:

머클 트리 (Merkle Tree) 나 머클 증명
암호학적 해시 함수
증명 생성 및 검증 프로토콜

목적: 분산 시스템에서 데이터 일관성에 대한 암호학적 증명 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
시스템 구성: 블록체인 기반 분산 원장 시스템

시나리오:

1. 시스템에 다음 트랜잭션 추가:
    - Tx1: "Alice가 Bob에게 5코인 전송"
    - Tx2: "Bob이 Charlie에게 2코인 전송"
2. 각 트랜잭션의 해시 생성:
    - H(Tx1) = a1b2c3…
    - H(Tx2) = d4e5f6…
3. 트랜잭션으로부터 머클 트리 구성:
    - 루트 해시 = H(H(Tx1) + H(Tx2))
4. 새 블록 생성 및 이전 블록과 연결
5. 클라이언트가 Tx1의 포함 여부 검증 요청:
    - 서버가 머클 증명 생성: Tx1, H(Tx2), 루트 해시
    - 클라이언트가 로컬에서 계산:
        - H(Tx1) = a1b2c3…
        - H(a1b2c3… + d4e5f6…) = 루트 해시
    - 계산 결과가 제공된 루트 해시와 일치하면 포함 확인
6. 데이터 변조 시도 시 해시 불일치로 즉시 감지 가능

엄격한 직렬화 (Strict Serializability)

선형화 가능성과 직렬화 가능성을 결합한 가장 강력한 일관성 모델.

구성:

모든 트랜잭션이 원자적으로 실행되는 것처럼 보임
트랜잭션 간의 실제 시간 순서 유지
모든 노드가 동일한 상태 변경 순서 관찰

목적: 분산 데이터베이스에서 최고 수준의 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

시스템 구성: Google Spanner와 같은 전역 분산 데이터베이스

시나리오:

1. 초기 상태: 계좌 A = 1000, 계좌 B = 500
2. 트랜잭션 T1 (10:00:01 시작):
    
    ```sql
    BEGIN;UPDATE accounts SET balance = balance - 100 WHERE id = 'A';UPDATE accounts SET balance = balance + 100 WHERE id = 'B';COMMIT;
    ```
    
3. 트랜잭션 T2 (10:00:02 시작):
    
    ```sql
    BEGIN;SELECT balance FROM accounts WHERE id IN ('A', 'B');COMMIT;
    ```
    
4. 엄격한 직렬화 보장:
    - T1이 T2보다 실제 시간상 먼저 시작되었으므로
    - T2는 반드시 T1의 변경사항이 적용된 상태(A=900, B=600)를 관찰해야 함
    - 모든 노드에서도 동일한 결과 관찰
5. 어떤 노드에 쿼리하더라도 트랜잭션 간 순서는 실제 시간 순서와 일치

타임 베이스 스냅샷 격리 (Time-based Snapshot Isolation)

글로벌 타임스탬프를 사용하여 트랜잭션에 일관된 스냅샷을 제공하는 기법.

구성:

글로벌 물리적 또는 논리적 시계
트랜잭션 시작 시 스냅샷 타임스탬프 할당
쓰기 - 쓰기 충돌 감지

목적: 대규모 분산 환경에서 일관된 읽기와 높은 동시성 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19

시스템 구성: 여러 데이터 센터에 분산된 CockroachDB 클러스터

시나리오:

1. 현재 HLC(Hybrid Logical Clock) 시간: 1621234567.000
2. 트랜잭션 T1 시작:
    - 시스템이 T1에 타임스탬프 1621234567.100 할당
    - T1에게 해당 시점의 일관된 데이터베이스 스냅샷 제공
3. 트랜잭션 T2가 테이블 X 업데이트:
    - 타임스탬프 1621234567.200 할당
    - 변경사항 커밋
4. T1이 테이블 X 읽기:
    - T1의 타임스탬프(1621234567.100)보다 이후에 발생한 T2의 변경사항(1621234567.200)은 보이지 않음
    - T1은 자신의 타임스탬프 시점의 일관된 스냅샷 유지
5. T1이 테이블 X와 Y에 대한 여러 읽기 작업 수행:
    - 모든 읽기가 동일한 시점의 일관된 데이터 반환
6. T1이 테이블 Z 업데이트 시도 및 커밋:
    - 다른 트랜잭션과 쓰기-쓰기 충돌 없으면 성공

낙관적 동시성 제어 (Optimistic Concurrency Control)

트랜잭션이 충돌 없이 완료될 것이라고 가정하고, 커밋 전에 충돌을 검사하는 방식.

구성:

읽기 단계: 데이터 읽기 및 로컬 복사본 유지
유효성 검사 단계: 다른 트랜잭션과의 충돌 검사
쓰기 단계: 충돌이 없으면 변경사항 적용

목적: 충돌이 적은 환경에서 높은 동시성 제공

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18

시스템 구성: 다중 노드 분산 데이터베이스, 버전 번호 기반 OCC 사용

시나리오:

1. 객체 X의 초기 버전: v1, 값: "data1"
2. 트랜잭션 T1이 X 읽기:
    - X의 현재 버전 v1과 값 "data1" 로컬 저장
3. 트랜잭션 T2도 X 읽기:
    - X의 현재 버전 v1과 값 "data1" 로컬 저장
4. T1이 X 수정: 값을 "data1-T1"으로 변경
5. T1 커밋 시도:
    - 유효성 검사: X의 현재 버전이 여전히 v1인지 확인 → 성공
    - X 업데이트: 버전 v2, 값 "data1-T1"
6. T2가 X 수정: 값을 "data1-T2"로 변경
7. T2 커밋 시도:
    - 유효성 검사: X의 현재 버전이 v1이 아닌 v2로 변경됨 → 실패
    - T2 중단 및 재시도 또는 사용자에게 충돌 알림

중앙 서버 모델 (Centralized Server Model)

모든 요청을 중앙 서버로 라우팅하여 일관성을 보장하는 방식.

구성:

단일 중앙 서버가 모든 쓰기 조정
읽기는 중앙 서버 또는 복제본에서 가능
복제본들은 중앙 서버와 동기화

목적: 간단한 구현으로 강한 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12

시스템 구성: 중앙 마스터와 여러 복제 슬레이브로 구성된 파일 저장 시스템

시나리오:

1. 클라이언트가 파일 F 업데이트 요청
2. 요청이 중앙 마스터 서버로 라우팅됨
3. 마스터 서버가 변경사항 적용 및 로그 기록
4. 마스터가 모든 슬레이브에 변경사항 전파
5. 각 슬레이브가 변경사항 적용 후 확인 응답
6. 모든(또는 쿼럼의) 슬레이브의 확인 후 클라이언트에 성공 응답
7. 이후 어떤 서버에서 읽어도 업데이트된 파일 내용 확인 가능

영구 로깅 (Write-ahead Logging, WAL)

데이터 변경 전에 변경 내용을 로그에 먼저 기록하여 내구성과 일관성을 보장하는 기법.

구성:

변경 작업 전 로그 레코드 기록
로그 레코드 동기식 디스크 플러시
로그 기반 복구 메커니즘

목적: 시스템 장애 발생 시에도 데이터 일관성 보장

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22

시스템 구성: 다중 노드 PostgreSQL 데이터베이스 클러스터

시나리오:

1. 트랜잭션 T 시작:
    
    ```sql
    BEGIN;UPDATE accounts SET balance = balance - 100 WHERE id = 1;UPDATE accounts SET balance = balance + 100 WHERE id = 2;
    ```
    
2. 각 UPDATE 문에 대한 WAL 레코드 생성:
    - LSN 1000: 계정 1 잔액 수정 (1000 → 900)
    - LSN 1001: 계정 2 잔액 수정 (500 → 600)
3. WAL 레코드를 디스크에 기록 및 동기화
4. 데이터 페이지 수정 (아직 디스크에 기록되지 않을 수 있음)
5. 트랜잭션 커밋 WAL 레코드 생성 및 동기화:
    - LSN 1002: 트랜잭션 T 커밋
6. 클라이언트에 성공 응답
7. 시스템 장애 발생 및 재시작:
    - WAL에서 커밋된 트랜잭션 T 발견
    - LSN 1000-1002 레코드 재실행하여 데이터 일관성 복구

비잔틴 장애 허용 (Byzantine Fault Tolerance, BFT)

일부 노드가 악의적으로 행동하거나 손상되어도 시스템이 정확하게 작동할 수 있도록 하는 방식.

구성:

3f+1 개 이상의 노드 (f 는 허용 가능한 악의적 노드 수)
다중 라운드 합의 프로토콜
암호학적 서명과 증명

목적: 적대적 환경에서도 일관성 유지

실제 예시:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19

시스템 구성: 10개 노드(최대 3개 악의적 노드 허용)로 구성된 PBFT(Practical Byzantine Fault Tolerance) 시스템

시나리오:

1. 클라이언트가 요청 R을 시스템에 전송
2. 주 노드(primary)가 요청을 수신하고 순서 번호 n 할당
3. 전처리 단계:
    - 주 노드가 <PRE-PREPARE, n, R, sig_p> 메시지를 모든 백업 노드에 전송
4. 준비 단계:
    - 각 백업 노드가 메시지 유효성 검증
    - 유효하면 <PREPARE, n, R, i, sig_i> 메시지를 모든 노드에 브로드캐스트
5. 커밋 단계:
    - 각 노드가 동일한 요청에 대해 2f+1개 이상의 PREPARE 메시지 수신
    - <COMMIT, n, R, i, sig_i> 메시지를 모든 노드에 브로드캐스트
6. 실행:
    - 각 노드가 동일한 요청에 대해 2f+1개 이상의 COMMIT 메시지 수신
    - 요청 실행 및 클라이언트에 응답
7. 클라이언트가 f+1개 이상의 동일한 응답 수신 시 결과 승인

구조 및 아키텍처

강한 일관성을 구현하는 분산 시스템의 일반적인 구조는 다음과 같다:

리더 - 팔로워 아키텍처 (Leader-Follower Architecture):
- 리더 노드: 모든 쓰기 작업을 처리하고 팔로워 노드에 복제한다.
- 팔로워 노드: 리더로부터 업데이트를 받아 동기화하고 읽기 작업을 처리한다.
- 기능: 중앙 집중식 조정을 통해 일관성을 유지하고 충돌을 방지한다.
쿼럼 기반 아키텍처 (Quorum-based Architecture):
- 쓰기 쿼럼 (Write Quorum): 쓰기 작업이 성공하기 위해 필요한 최소 노드 수이다.
- 읽기 쿼럼 (Read Quorum): 읽기 작업이 성공하기 위해 필요한 최소 노드 수이다.
- 기능: W + R > N (W: 쓰기 쿼럼, R: 읽기 쿼럼, N: 총 노드 수) 일 때 강한 일관성을 보장한다.
합의 기반 아키텍처 (Consensus-based Architecture):
- 제안자 노드 (Proposer Nodes): 값을 제안하고 합의 프로세스를 시작한다.
- 수락자 노드 (Acceptor Nodes): 제안된 값에 투표하고 합의를 형성한다.
- 학습자 노드 (Learner Nodes): 합의된 값을 배우고 적용한다.
- 기능: Paxos 나 Raft 와 같은 합의 알고리즘을 통해 분산 환경에서 합의를 이룬다.

구성 요소

강한 일관성을 구현하는 시스템의 주요 구성 요소는 다음과 같다:

구성 요소	기능	역할
분산 락 매니저 (Distributed Lock Manager)	여러 노드 간 데이터 접근을 조정하여 동시 쓰기 충돌 방지	트랜잭션이 특정 데이터에 배타적으로 접근하도록 보장
트랜잭션 코디네이터 (Transaction Coordinator)	2 단계 커밋 (2PC) 등 분산 트랜잭션 조정	모든 참여 노드가 함께 커밋 또는 롤백되도록 보장
합의 모듈 (Consensus Module)	Paxos, Raft 등의 합의 알고리즘 구현	노드 간 상태 일관성을 유지
복제 관리자 (Replication Manager)	주 노드에서 복제본으로 데이터 동기화 복제 수행	모든 노드가 동일한 데이터를 갖도록 보장
상태 머신 (State Machine)	합의된 순서에 따라 연산을 처리 및 적용	모든 노드에서 동일한 상태 유지 보장
로그 관리자 (Log Manager)	상태 변경 사항을 로그로 기록 및 관리	장애 복구 및 일관성 유지를 위한 근거 제공

장점과 단점

구분	항목	설명
✅ 장점	데이터 정확성	항상 최신 데이터 보장
	충돌 방지	동시 쓰기로 인한 충돌 발생 없음
	예측 가능한 시스템 동작	일관된 데이터로 인해 시스템의 동작이 예측 가능
	데이터 무결성	중요한 비즈니스 규칙이나 제약 조건이 항상 유지된다
⚠ 단점	가용성	네트워크 분할 시 서비스 중단 가능
	지연 시간	동기 복제로 인한 높은 latency
	확장성 제한	노드 증가 시 성능 저하
	성능 저하 가능성	높은 일관성을 유지하기 위해 노드 간의 동기화가 필요하여 성능이 저하될 수 있다.
	자원 소비 증가	동기화와 조정에 더 많은 네트워크 통신과 컴퓨팅 자원이 필요

도전 과제

강한 일관성을 구현하는 데 있어 주요 도전 과제는 다음과 같다:

네트워크 지연 및 장애: 분산 시스템에서 노드 간 통신 지연이나 네트워크 장애는 강한 일관성 유지를 어렵게 만든다.
확장성 제약: 노드 수가 증가함에 따라 합의 프로세스의 오버헤드도 증가하여 확장성이 제한된다.
CAP 정리의 제약: 강한 일관성을 선택하면 분할 상황에서 가용성이 희생된다.
성능과의 균형: 강한 일관성과 성능 사이의 균형을 맞추는 것이 어렵다.
분산 합의 알고리즘 구현: Paxos, Raft 와 같은 알고리즘의 정확한 구현은 복잡하고 오류가 발생하기 쉽다.

실무 적용 예시

분야	적용 사례	구현 기술	이점
금융 서비스	은행 계좌 잔액 관리, 자금 이체 시스템, 결제 처리	두 단계 커밋, 분산 트랜잭션	데이터 정확성, 회계 규정 준수
예약 시스템	항공권 예약, 호텔 예약, 티켓 판매	쿼럼 기반 프로토콜, 분산 락	이중 예약 방지, 일관된 재고 관리
데이터베이스	RDBMS, 일부 분산 데이터베이스	Paxos, Raft, 두 단계 커밋	ACID 트랜잭션, 데이터 무결성
분산 파일 시스템	분산 저장소의 메타데이터 관리	합의 알고리즘, 리더 - 팔로워 복제	일관된 파일 메타데이터, 충돌 방지
구성 관리	분산 시스템의 구성 정보, 서비스 레지스트리	ZooKeeper, etcd, Consul	일관된 구성 정보, 시스템 안정성

활용 사례

사례 1

온라인 뱅킹 시스템에서의 강한 일관성 적용

온라인 뱅킹 시스템은 강한 일관성이 필수적인 대표적인 사용 사례이다.
고객이 계좌 간 자금을 이체할 때, 시스템은 다음과 같은 방식으로 강한 일관성을 유지한다:

시나리오: 고객 A 가 자신의 저축 계좌에서 당좌 계좌로 100 만원을 이체하려고 한다.
트랜잭션 시작: 시스템은 분산 트랜잭션을 시작하여 두 계좌의 잔액을 함께 업데이트한다.
두 단계 커밋 적용:
- 준비 단계: 트랜잭션 코디네이터가 저축 계좌와 당좌 계좌를 관리하는 모든 데이터베이스 노드에 트랜잭션 준비를 요청한다.
- 커밋 단계: 모든 노드가 준비됐다고 응답하면, 코디네이터는 트랜잭션을 커밋하도록 지시한다.
동기식 복제: 커밋된 변경사항은 모든 복제본 노드에 동기적으로 복제된다.
결과: 어떤 노드에서 조회하더라도 고객은 항상 정확한 계좌 잔액을 볼 수 있다.

1
2
3
4
[사용자] → [주 노드: 잔액 감소]  
→ 복제본 1: 동기 업데이트 ✔️  
→ 복제본 2: 동기 업데이트 ✔️  
→ 트랜잭션 완료 → 사용자에게 성공 통보

이 사례에서 강한 일관성은 중요한 금융 트랜잭션의 정확성과 무결성을 보장하며, 고객이 항상 최신 계좌 정보를 볼 수 있도록 한다. 이를 통해 금융 규정을 준수하고 고객 신뢰를 유지할 수 있다.

실무에서 효과적으로 적용하기 위한 고려사항 및 주의할 점

영역	고려사항	영향	권장 접근법
아키텍처 설계	시스템 분할 방식	네트워크 통신 오버헤드, 합의 복잡성에 영향	관련 데이터를 동일한 파티션에 배치
	리더 - 팔로워 vs 쿼럼 기반	성능과 가용성 특성이 달라짐	워크로드와 가용성 요구사항에 맞게 선택
네트워크 설계	네트워크 지연 시간	트랜잭션 처리 시간과 응답성에 직접적 영향	지리적으로 가까운 노드 배치, 최적화된 프로토콜 사용
	대역폭 제한	동기화 데이터 전송량에 영향	압축 기술 활용, 효율적인 데이터 직렬화
장애 처리	네트워크 분할 상황	가용성이 저하될 수 있음	자동 복구 메커니즘, 부분적 가용성 전략 구현
	노드 장애	쿼럼을 형성할 수 없을 때 진행 불가	적절한 노드 수 유지, 리더 선출 전략 최적화
성능 최적화	읽기 성능	강한 일관성은 읽기 성능을 저하시킬 수 있음	읽기 전용 복제본, 캐싱 전략 활용
	쓰기 지연 시간	동기식 복제는 쓰기 지연 시간을 증가시킴	배치 처리, 효율적인 합의 알고리즘 구현
구현 복잡성	합의 알고리즘 구현	버그가 발생하기 쉽고 디버깅이 어려움	검증된 라이브러리 사용, 철저한 테스트
	분산 트랜잭션	구현과 유지보수가 복잡함	트랜잭션 범위 제한, 명확한 경계 설정
확장성	노드 수 증가	합의에 참여하는 노드가 많을수록 성능 저하	샤딩 전략, 계층적 합의 구조 고려
	지리적 분산	지역 간 지연 시간이 일관성에 영향	지역별 클러스터, 지역 간 비동기 복제 고려

최적화하기 위한 고려사항 및 주의할 점

영역	최적화 전략	이점	구현 시 주의사항
복제 전략	선택적 동기 복제	중요한 데이터만 강한 일관성 적용	일관성 모델 혼합 사용 시 복잡성 증가
	지역 기반 복제	지역 내 지연 시간 최소화	지역 간 일관성 관리 필요
합의 최적화	합의 프로토콜 튜닝	합의 라운드 수 최소화, 빠른 결정	안정성과 성능 사이 균형 필요
	리더 중심 최적화	리더를 통한 효율적인 조정	리더 장애 시 빠른 복구 메커니즘 필요
캐싱 전략	일관성이 보장된 캐싱	읽기 성능 향상, 지연 시간 감소	캐시 무효화 및 일관성 유지 메커니즘 필요
	로컬 읽기 최적화	지역 내 읽기 작업 가속화	캐시와 실제 데이터 간 일관성 관리 필요
배치 처리	트랜잭션 배치화	여러 작업을 하나의 합의 라운드로 처리	배치 크기와 지연 시간 사이 균형 필요
	비동기 준비 작업	실제 커밋 전 사전 작업 수행	실패 시 정리 작업 관리 필요
네트워크 최적화	효율적인 직렬화	네트워크 대역폭 사용 최소화	직렬화/역직렬화 오버헤드 고려
	데이터 압축	네트워크 전송량 감소	CPU 사용량과 압축률 사이 균형 필요
알고리즘 선택	워크로드에 맞는 합의 알고리즘	특정 패턴에 최적화된 성능	알고리즘 특성과 요구사항 일치 확인
	하이브리드 접근법	다양한 데이터 유형에 적합한 일관성 모델	다양한 일관성 모델 관리 복잡성 증가

주제와 관련하여 주목할 내용

주제	항목	설명
CRDTs (충돌 없는 복제 데이터 타입)	강한 일관성과의 융합	CRDTs 와 강한 일관성 모델을 결합하여 특정 데이터 타입에 대해 더 효율적인 강한 일관성을 제공하는 하이브리드 접근법이 주목받고 있습니다.
블록체인 기술	합의 메커니즘 혁신	블록체인의 합의 메커니즘이 전통적인 분산 시스템의 강한 일관성 구현에 영향을 미치며, 특히 퍼블릭 환경에서의 강한 일관성 구현에 새로운 가능성을 제시합니다.
다중 데이터 센터 최적화	글로벌 강한 일관성	지리적으로 분산된 다중 데이터 센터 환경에서 강한 일관성을 제공하면서도 지연 시간을 최소화하는 기술이 발전하고 있습니다.
하드웨어 가속	특수 프로세서 지원	FPGA 나 특수 목적 프로세서를 활용하여 합의 알고리즘을 하드웨어 수준에서 가속화하는 연구가 진행 중입니다.
자체 안정화 시스템	자가 복구 일관성	네트워크 분할이나 노드 장애 후 자동으로 강한 일관성을 복구하고 유지하는 자체 안정화 시스템이 주목받고 있습니다.

앞으로의 전망

주제	항목	설명
일관성과 성능의 균형	적응형 일관성 모델	미래에는 워크로드와 애플리케이션 요구사항에 따라 자동으로 일관성 수준을 조정하는 시스템이 표준이 될 것으로 예상됩니다.
양자 컴퓨팅 영향	양자 합의 알고리즘	양자 컴퓨팅의 발전으로 기존 합의 알고리즘의 한계를 뛰어넘는 새로운 강한 일관성 구현 방식이 등장할 것입니다.
인공지능 통합	AI 기반 일관성 관리	인공지능이 네트워크 상태와 애플리케이션 패턴을 분석하여 최적의 일관성 전략을 자동으로 선택하는 시스템이 발전할 것입니다.
새로운 하드웨어 기술	비휘발성 메모리와의 통합	새로운 비휘발성 메모리 기술의 발전으로 기존 강한 일관성 모델의 성능 한계를 극복하는 새로운 접근법이 등장할 것입니다.
규제 및 표준화	금융 및 의료 분야 표준	금융, 의료 등 중요 산업에서 강한 일관성에 대한 규제와 표준이 더욱 엄격해지며, 이를 충족하는 새로운 기술이 발전할 것입니다.

주제와 관련하여 추가적으로 학습해야할 내용

카테고리	주제	설명
이론적 기반	분산 시스템 이론	분산 시스템의 기본 개념과 CAP 정리, FLP 불가능성 정리 등 이론적 기반에 대한 이해가 필요합니다.
알고리즘	분산 합의 알고리즘	Paxos, Raft, PBFT 등 다양한 합의 알고리즘의 동작 원리와 구현 방법에 대한 심층 학습이 필요합니다.
	트랜잭션 프로토콜	두 단계 커밋, 세 단계 커밋 등 분산 트랜잭션 프로토콜의 작동 원리와 구현 방법을 학습해야 합니다.
아키텍처	분산 데이터베이스 설계	강한 일관성을 지원하는 분산 데이터베이스의 아키텍처와 설계 원칙을 이해해야 합니다.
	리더 선출 메커니즘	분산 환경에서 리더를 선출하고 장애 시 복구하는 다양한 메커니즘에 대한 학습이 필요합니다.
구현	네트워크 프로그래밍	분산 노드 간 효율적인 통신과 메시징 구현 방법에 대한 지식이 필요합니다.
	병렬 처리	멀티스레드 프로그래밍과 동시성 제어 메커니즘에 대한 이해가 필요합니다.
최적화	분산 시스템 성능 튜닝	네트워크 지연, 처리량, 자원 활용도 등을 최적화하는 기법을 학습해야 합니다.
	장애 처리 및 복구	네트워크 분할, 노드 장애 등 다양한 장애 상황에서의 처리와 복구 전략을 이해해야 합니다.
실제 사례	오픈소스 구현 분석	ZooKeeper, etcd, Google Spanner 등 강한 일관성을 구현한 실제 시스템의 설계와 구현을 분석해야 합니다.

주제와 관련하여 추가로 알아야 하거나 학습해야할 내용

카테고리	주제	설명
관련 기술	CRDTs	충돌 없는 복제 데이터 타입 (Conflict-free Replicated Data Types) 은 강한 일관성의 대안 또는 보완 기술로 중요합니다.
	블록체인 합의	PoW, PoS, PBFT 등 블록체인 기술에서 사용되는 합의 메커니즘과 강한 일관성의 관계를 이해해야 합니다.
	시계 동기화	NTP, Logical Clocks, Google 의 TrueTime 등 분산 환경에서의 시계 동기화 기술이 강한 일관성에 미치는 영향을 학습해야 합니다.
보안 측면	분산 시스템 보안	강한 일관성을 유지하면서도 보안을 보장하는 방법과 잠재적 취약점을 이해해야 합니다.
	비잔틴 장애 허용	악의적인 노드가 존재할 수 있는 환경에서의 강한 일관성 보장 방법을 학습해야 합니다.
클라우드 환경	멀티 클라우드 일관성	여러 클라우드 제공자에 걸친 환경에서 강한 일관성을 구현하는 방법을 이해해야 합니다.
	서버리스 아키텍처	서버리스 환경에서 강한 일관성을 구현하는 방법과 제약사항을 학습해야 합니다.
관련 산업	금융 기술 사례	금융 산업에서 강한 일관성이 어떻게 구현되고 활용되는지 실제 사례를 통해 이해해야 합니다.
	의료 정보 시스템	환자 데이터의 정확성이 중요한 의료 정보 시스템에서의 강한 일관성 적용 사례를 학습해야 합니다.
확장 개념	혼합 일관성 모델	다양한 일관성 모델을 혼합하여 사용하는 하이브리드 접근법에 대한 이해가 필요합니다.
	자가 관리 시스템	일관성 수준을 자동으로 관리하고 최적화하는 자가 관리 시스템의 설계와 구현을 학습해야 합니다.

용어 정리

용어	설명
CAP 정리	분산 시스템에서 일관성 (Consistency), 가용성 (Availability), 분할 내성 (Partition Tolerance) 세 가지 속성을 동시에 만족할 수 없다는 이론
두 단계 커밋 (Two-Phase Commit)	분산 환경에서 트랜잭션의 원자성을 보장하기 위한 프로토콜로, 준비 단계와 커밋 단계로 구성됨
쿼럼 (Quorum)	분산 시스템에서 작업이 진행되기 위해 필요한 최소한의 노드 수
선형화 가능성 (Linearizability)	모든 작업이 원자적으로 수행되며 실시간 순서가 보존되는 가장 강력한 일관성 모델
합의 알고리즘 (Consensus Algorithm)	분산 시스템에서 여러 노드가 특정 값이나 상태에 동의하도록 하는 알고리즘
Paxos	Leslie Lamport 가 개발한 분산 합의 알고리즘으로, 강한 일관성을 구현하는 데 사용됨
Raft	Paxos 보다 이해하기 쉽게 설계된 분산 합의 알고리즘으로, 리더 선출, 로그 복제, 안전성 보장의 세 가지 하위 문제로 분해됨
동기식 복제 (Synchronous Replication)	주 노드의 쓰기 작업이 모든 복제본에 적용된 후에야 완료되는 복제 방식

참고 및 출처

Sequential Consistency

순차적 일관성 (Sequential Consistency) 순차적 일관성은 분산 시스템에서 데이터 일관성 문제를 해결하기 위한 모델로, 모든 프로세스의 연산이 하나의 글로벌 순서에 따라 실행된 것처럼 보이게 하며 각 개별 프로세스의 연산은 프로그램에 명시된 순서대로 유지된다. 강력한 일관성보다는 약하지만 인과적 일관성보다는 강력한 이 모델은 공유 메모리 시스템, 분산 데이터 저장소, 협업 애플리케이션 등에서 널리 활용된다. 핵심 개념 순차적 일관성 (Sequential Consistency) 은 분산 시스템에서 알아야 하는 일관성 모델이다. 레슬리 램포트 (Leslie Lamport) 가 1979 년 “How to Make a Multiprocessor Computer That Correctly Executes Multiprocess Programs” 논문에서 제안한 이 개념은 다음과 같이 정의된다: ...

Linearizability

선형화 가능성 (Linearizability) 선형화 가능성 (Linearizability) 은 분산 시스템에서 가장 강력한 일관성 모델로, 여러 프로세스가 공유 객체에 접근할 때 각 작업이 실제 발생 시간 사이에 원자적으로 실행된 것처럼 보이도록 한다. 이는 CAP 정리에서 말하는 일관성 (C) 에 해당하며, 모든 노드가 데이터의 동일한 상태를 볼 수 있도록 보장한다. 그러나 높은 일관성을 제공하는 대신 가용성과 파티션 내성 간의 균형을 맞추는 것이 핵심 과제이다. 데이터베이스, 분산 키 - 값 저장소, 공유 레지스터 등 다양한 시스템에서 활용된다. ...

강한 일관성 (Strong Consistency)#

핵심 개념#

목적 및 필요성#

주요 기능 및 역할#

특징#

핵심 원칙#

주요 원리 및 작동 원리#

구현 기법#

단일 리더 복제 (Single-Leader Replication)#

쿼럼 기반 접근 (Quorum-based Approach)#

2 단계 커밋 프로토콜 (Two-Phase Commit, 2PC)#

3 단계 커밋 프로토콜 (Three-Phase Commit, 3PC)#

합의 알고리즘 (Consensus Algorithms)#

Paxos#

Raft#

Zab (ZooKeeper Atomic Broadcast)#

분산 락 (Distributed Locks)#

분산 트랜잭션 (Distributed Transactions)#

동기식 복제 (Synchronous Replication)#

타임스탬프 기반 조정 (Timestamp-based Coordination)#

다중 버전 동시성 제어 (Multi-Version Concurrency Control, MVCC)#

전체 복제 (Full Replication)#

선형화 가능성 (Linearizability)#

거래 메모리 (Transactional Memory)#

증명 가능한 데이터 구조 (Verifiable Data Structures)#

엄격한 직렬화 (Strict Serializability)#

타임 베이스 스냅샷 격리 (Time-based Snapshot Isolation)#

낙관적 동시성 제어 (Optimistic Concurrency Control)#

중앙 서버 모델 (Centralized Server Model)#

영구 로깅 (Write-ahead Logging, WAL)#

비잔틴 장애 허용 (Byzantine Fault Tolerance, BFT)#

구조 및 아키텍처#

구성 요소#

장점과 단점#

도전 과제#

실무 적용 예시#

활용 사례#

사례 1#

실무에서 효과적으로 적용하기 위한 고려사항 및 주의할 점#

최적화하기 위한 고려사항 및 주의할 점#

주제와 관련하여 주목할 내용#

앞으로의 전망#

주제와 관련하여 추가적으로 학습해야할 내용#

주제와 관련하여 추가로 알아야 하거나 학습해야할 내용#

용어 정리#

참고 및 출처#

강한 일관성 (Strong Consistency)

핵심 개념

목적 및 필요성

주요 기능 및 역할

특징

핵심 원칙

주요 원리 및 작동 원리

구현 기법

단일 리더 복제 (Single-Leader Replication)

쿼럼 기반 접근 (Quorum-based Approach)

2 단계 커밋 프로토콜 (Two-Phase Commit, 2PC)

3 단계 커밋 프로토콜 (Three-Phase Commit, 3PC)

합의 알고리즘 (Consensus Algorithms)

Paxos

Raft

Zab (ZooKeeper Atomic Broadcast)

분산 락 (Distributed Locks)

분산 트랜잭션 (Distributed Transactions)

동기식 복제 (Synchronous Replication)

타임스탬프 기반 조정 (Timestamp-based Coordination)

다중 버전 동시성 제어 (Multi-Version Concurrency Control, MVCC)

전체 복제 (Full Replication)

선형화 가능성 (Linearizability)

거래 메모리 (Transactional Memory)

증명 가능한 데이터 구조 (Verifiable Data Structures)

엄격한 직렬화 (Strict Serializability)

타임 베이스 스냅샷 격리 (Time-based Snapshot Isolation)

낙관적 동시성 제어 (Optimistic Concurrency Control)

중앙 서버 모델 (Centralized Server Model)

영구 로깅 (Write-ahead Logging, WAL)

비잔틴 장애 허용 (Byzantine Fault Tolerance, BFT)

구조 및 아키텍처

구성 요소

장점과 단점

도전 과제

실무 적용 예시

활용 사례

사례 1

실무에서 효과적으로 적용하기 위한 고려사항 및 주의할 점

최적화하기 위한 고려사항 및 주의할 점

주제와 관련하여 주목할 내용

앞으로의 전망

주제와 관련하여 추가적으로 학습해야할 내용

주제와 관련하여 추가로 알아야 하거나 학습해야할 내용

용어 정리

참고 및 출처