콘텐츠로 바로가기

Statistical Inference & Estimation

관측된 표본 데이터를 바탕으로 모집단의 정체를 추측하는 통계적 추론 방법론과, 모델의 파라미터를 결정하는 최적 추정의 원리를 다루는 학습 노드입니다.

sys.entry
M

Me

hyunyoun's Blog

posts6 min read

1. Overview

통계적 추론 및 추정(Statistical Inference & Estimation, SIE)은 "우리가 가진 데이터가 전체 세상을 얼마나 잘 대변하는가"라는 본질적인 질문에 대답하는 학문입니다.

확률론이 모델로부터 데이터를 예측한다면, SIE는 수집된 데이터로부터 모델의 모수(Parameter)를 거꾸로 찾아냅니다. 학습자는 미지의 값을 가장 가능성 있게 맞추는 최대 우도 추정(MLE), 가설의 진위 여부를 확률적으로 판정하는 가설 검정(Hypothesis Testing), 그리고 추측의 불확실성을 범위로 표현하는 **신뢰 구간(Confidence Interval)**의 물리적 원리를 배웁니다. 이를 통해 데이터 기반의 의사결정에 수리적 타당성을 부여하고, 머신러닝 모델의 파라미터가 왜 그 값이어야 하는지에 대한 통계적 정당성을 확보합니다.

2. Scope & Boundaries

In-Scope

  • Parameter Estimation: 점 추정(Point Estimation) 및 모델 적합성 분석
  • Likelihood Physics: 가능도(Likelihood) 함수의 정의 및 미분을 통한 MLE 최적화
  • Standard Hypothesis Testing: 귀무가설(H0H_0), 대립가설(H1H_1) 및 pp-value의 물리적 해석
  • Interval Estimation: 오차 범위와 신뢰 수준에 따른 신뢰 구간 산출 기법

Out-of-Scope

  • 다변량 통계 분석의 고차원 수식 증명 (전문 통계학 영역)
  • 특정 사회과학적 표본 설계 기법 (조사방법론 영역)

Boundaries

  • SIE vs. Machine Learning: 머신러닝이 '예측의 정확도'에 집중한다면, SIE는 '추정값의 불확실성과 통계적 유의성'이라는 내재적 신뢰도 분석에 집중합니다.

3. Counterexample

  • 단순히 "평균과 표준편차를 구하는 것"은 SIE 학습이 아닙니다. 왜 특정 데이터 샘플에서 구한 평균이 모집단의 평균에 대한 **비편향 추정량(Unbiased Estimator)**이 되는지 수리적으로 설명할 수 있어야 하고, pp-value가 0.05보다 작다고 해서 그것이 반드시 '효과가 크다'는 기계적 결론으로 이어지는 것이 아님을 논리적으로 비판할 수 있어야 합니다.

4. Prerequisites

  • Probability Spaces & Random Variables (Basic): 확률 분포와 기댓값 이해가 필수입니다. (04-01 PRV)
  • Optimization & Convex Geometry (Recommended): 최대 우도를 찾기 위한 최적화 기법이 권장됩니다. (03-04 OCG)

5. Learning Map

  1. Sampling Physics: 전체(Population)를 알 수 없는 상태에서 부분(Sample)을 통해 세상을 보는 법을 익힙니다.
  2. Finding Modality: 관측값들이 나올 확률이 가장 높은 모수(MLE)를 수학적으로 사냥합니다.
  3. Validating Claims: 주장(Hypothesis)이 우연에 의한 것인지 아니면 통계적으로 실재하는 것인지 검증합니다.
  4. Quantifying Doubt: 추정치가 가질 수 있는 필연적인 오차의 범위를 신뢰할 수 있는 구간으로 고정합니다.

6. Learning Topics

Basic

Core: 통계적 샘플링과 추정량 (Sampling Foundations)

  • Why to Learn: 작은 표본 데이터가 전체 시스템의 지표를 대표할 수 있는 수리적 근거를 마련하기 위함입니다.
  • What to Learn:
    • 모집단 vs 표본의 물리적 구분
    • 표집 분포(Sampling Distribution)와 표준 오차(Standard Error)
    • 일치성(Consistency)과 효율성(Efficiency)의 추정량 조건
  • How to Learn:
    • 중심 극한 정리(CLT) 시뮬레이션을 통해 표본 평균이 모집단 평균으로 수렴하는 물리적 과정 관찰
    • 표본 분산 계산 시 왜 nn이 아닌 n1n-1로 나누는지(Bessel's correction) 논리적 증명 실습
  • Implement: 대규모 배열에서 무작위 샘플링을 수행하고 표본 평균의 변화를 추적하는 분석기

Core: 최대 우도 추정과 가능도 물리 (Likelihood Mechanics)

  • Why to Learn: 주어진 데이터에 가장 잘 맞는 '최선의 모델'을 찾는 수학적 표준 기법이기 때문입니다.
  • What to Learn:
    • 가능도(Likelihood)의 정의: 데이터가 관측될 조건부 확률 물리
    • 로그 가능도(Log-Likelihood): 연산 편의와 수치적 안정성을 위한 변환
    • 정규 분포 및 베르누이 분포 모수의 MLE 유도 과정
  • How to Learn:
    • 동전 던지기 결과(H,TH, T)를 보고 앞면이 나올 확률(pp)을 MLE 수식으로 직접 계산 연습
    • 함수의 극대값을 찾기 위해 가능도 함수를 미분하여 0이 되는 지점을 도출하는 실습
  • Implement: 데이터 포인트들을 입력받아 가장 적합한 정규 분포 파라미터를 제안하는 MLE 추정기

Practical

Core: 가설 검정과 의사결정 (Hypothesis & P-value)

  • Why to Learn: 실험 데이터의 변화가 유의미한지, 아니면 단순한 노이즈인지 냉철하게 판별하기 위함입니다.
  • What to Learn:
    • 1종 오류(α\alpha)와 2종 오류(β\beta)의 물리적 트레이드오프
    • 유의 수준(Significance Level)과 유의 확률(pp-value)의 상관관계
    • Z-검정, T-검정의 선택 기준 및 수리적 프로세스
  • How to Learn:
    • 서비스의 UI를 변경했을 때 클릭률(CTR) 상승이 통계적으로 유의한지 A/B 테스트 가설 검정 설계
    • '통계적으로 유의하다'는 말이 '실질적인 가치가 있다'는 말과 다를 수 있음을 실제 데이터로 분석
  • Implement: 두 그룹의 데이터를 입력받아 T-검정 결과를 출력(pp-value 포함)해주는 통계 엔진

Advanced

Core: 회귀 분석과 통계적 신뢰 (Regression & Confidence)

  • Why to Learn: 변수들 사이의 인과 관계를 수식화하고, 그 관계의 강도를 신뢰 구간으로 보증하기 위해서입니다.
  • What to Learn:
    • 선형 회귀(Linear Regression)의 통계적 가정(Gauss-Markov)
    • 결정 계수(R2R^2)와 조정된 R2R^2의 데이터 설명력 물리
    • 회귀 계수에 대한 신뢰 구간(Confidence Interval) 및 유의성 검정
  • How to Learn:
    • 광고비 지출과 매출액 사이의 선형 모델을 구축하고, 모델이 데이터를 얼마나 잘 설명하는지 잔차(Residual) 분석 연습
    • 신뢰 구간 95%의 의미를 "100번 실험했을 때 95번은 범위 내에 들어옴"이라는 물리적 빈도로 이해
  • Implement: 최소 제곱법(LSM)을 사용하여 최적 회귀선을 작도하고 지표를 산출하는 프로그램

7. Terminology

Term (EN / ko, abbr) 1문장 정의 단계(기본/권장/실무/심화) 역할/맥락 관련 개념 유사/대비/함께 사용 오해 포인트 Evidence(Primary/Secondary/Industry) Flags(core)
Inference (추론) 표본 데이터의 정보를 사용하여 모집단의 특성에 대한 결론을 도출하는 수리적 행위입니다. 기본 도구적 목적 Estimation Logic '단순 추측'과 혼동 P1:CS2023/Probability core
MLE (최대우도추정) 주어진 관측치를 생성할 가능성이 가장 높은 파라미터 값을 찾는 데이터 적합 기술입니다. 추천 모수 결정 Likelihood Optimization '확률이 높음'과 엄밀히 다름 P4 core
P-value 귀무가설이 참일 때, 실제 관측된 데이터 이상으로 극단적인 결과가 나올 확률 물리입니다. 실무 유의성 지표 Hypothesis Error Type I '가설이 맞을 확률'로 오해 P4 core
Consistency (일치성) 표본의 크기가 무한히 커질수록 추정량이 모수에 물리적으로 수렴하는 안정적 성질입니다. 심화 신뢰성 증명 Bias Converge '정확함'과만 혼동 P4 core

8. References

Primary

Secondary

  • [Statistics] Freedman, Pisani, Purves — The intuition-first classic text.
  • [All of Statistics] Larry Wasserman — A concise course in statistical inference.

Industry

  • [Google Developers: A/B Testing Guide] — Statistical inference in industry.
  • [NIST Engineering Statistics Handbook] — Practical engineering statistics.

9. Final Checklist

Primary

  • '점 추정'과 '구간 추정'의 차이를 정보의 확실성 및 신뢰도 관점에서 물리적으로 설명 가능한가? (P1)
  • 귀무가설을 기각하지 못했을 때, 그것이 "가설이 참임을 증명했다"는 의미가 아닌 물리적 이유를 기술할 수 있는 가? (P1)

Secondary

  • 로그 가능도(Log-Likelihood)를 사용했을 때 멀티플리케이션(Multiplication)이 서메이션(Summation)으로 바뀌어 연산 효율이 높아지는 이유를 증명할 수 있는가?
  • 1종 오류와 2종 오류의 관계를 사이렌 소리(임계치 결정) 모델을 통해 기하학적으로 설명 가능한가?

Industry

  • 신규 기능 배포 전 진행한 통계 검정 결과가 유의미하지 않게 나왔을 때, 표본 크기(nn)의 부족 가능성을 수리적으로 분석하여 후속 제안을 할 수 있는 가? (SFIA)
  • 비즈니스 리포팅 시, 단순 지표 수치가 아닌 '오차 범위'와 '신뢰 수준'을 명시하여 데이터 기반의 정직한 보고를 수행할 수 있는 가?