콘텐츠로 바로가기

Machine Learning & AI

통계적 수학과 대규모 하드웨어 연산을 결합하여 기계가 스스로 규칙을 추출하고, 인간의 고등 추론을 수리적으로 모사하는 인공지능의 모든 계층을 다룹니다.

sys.entry
M

Me

hyunyoun's Blog

posts7 min read

1. Overview

기계 학습 및 인공지능(Machine Learning & AI, MAI)은 데이터 속에 숨겨진 고차원적 패턴을 수리적으로 포착하고, 이를 기반으로 예측, 생성, 추론을 수행하는 '지능의 디지털 공학'입니다. 본 카테고리는 통계학적 기초부터 현대의 거대 언어 모델(LLM), 그리고 이를 실제 워크로드에서 가동하는 운영 체계(MLOps)까지의 전 과정을 다룹니다.

CS2023의 Artificial Intelligence (AI) 지식 영역과 DS-BoK(Data Science Body of Knowledge)을 근간으로 삼아, 단순한 모델 학습을 넘어 실제 비즈니스 가치를 창출하기 위한 최적의 지능형 아키텍처와 엔지니어링 패러다임을 탐구합니다.

2. Scope & Boundaries

In-Scope

  • ML 기초 및 알고리즘: 지도/비지도/강화 학습의 학습 체계, 결정 트리 및 앙상블 기법.
  • 딥러닝 아키텍처: CNN(시각), RNN(시계열), Transformer(문맥), Diffusion(생성)의 연산 기전.
  • 자연어 처리 및 LLM: Prompt Engineering, RAG(Retrieval-Augmented Generation), 파인튜닝 전략.
  • AI 시스템 엔지니어링: MLOps 파이프라인, 모델 압축/양자화, 서빙 인프라 최적화.

Out-of-Scope

  • 순수 통계학 이론: 모델링과 무관한 고수준의 확률 통계 증명 (01. MATL 노드로 위임).
  • 데이터베이스 내부 커널: 학습 데이터 저장소의 물리적 입출력 최적화 (06. DIM 노드로 위임).
  • 일반 웹 서비스 비즈니스: AI 추론과 무관한 일반적인 백엔드 서버 로직 (14. Web 노드로 위임).

Boundaries

  • MAI는 단순한 '코드 구현'보다 **'데이터 분포로부터의 일반화 성능'**과 **'추론 결과의 수리적 신뢰도 및 해석 가능성'**을 입체적으로 관리하는 것에 집중합니다.

3. Counterexample

  • 단순 API 및 라이브러리 호출: OpenAI API 응답을 파싱하거나 Scikit-learn 함수 하나를 호출하는 것은 활용 단계입니다. 왜 특정 입력에서 **할루시네이션(Hallucination)**이 발생하는지, 혹은 경사 소실(Vanishing Gradient) 문제를 해결하기 위해 어떤 정규화(Normalization) 기법이 적용되는지 원리를 분석해야 합니다.
  • 하이퍼파라미터 무작위 대입: "그냥 성능이 좋아서" 값을 바꾸는 것은 공학이 아닙니다. 손실 함수(Loss Function)의 곡률과 경사 하강법(Gradient Descent)의 학습률(Learning Rate) 스케줄링이 모델의 수렴 속도에 미치는 영향을 수학적으로 해석할 수 있어야 합니다.

4. Prerequisites

  • 수학적 기초 (Basic): 미적분(편미분), 선형대수(행렬 공식), 통계학적 가설 검정과 확률 분포 이해. (P1)
  • 자료구조 및 알고리즘 (Recommended): 대규모 텐서(Tensor) 연산을 위한 다차원 배열 구조 및 복잡도 분석. (P1)
  • 컴퓨터 구조 (Practical): GPU/NPU 가속 원리 및 메모리 대역폭이 학습 성능에 미치는 영향 이해. (P1)

5. Learning Map

  1. Statistical Learning: 데이터로부터 유의미한 패턴을 추출하는 확률론적 기초와 회귀/분류 원리를 다집니다. (P4)
  2. Neural Mechanisms: 다층 신경망을 통한 비선형 특징 추출(Feature Extraction)과 역전파 알고리즘을 익힙니다. (P1)
  3. Foundation Models: Transformer 구조와 사전 학습(Pre-training)을 통한 거대 지능 모델의 생성 원리를 배웁니다.
  4. Agentic Engineering: 학습된 모델을 실제 서비스에 이식하고 지능적인 워크플로우를 자동화하는 MLOps 체계를 구축합니다. (P5)

6. Learning Topics

Basic

Core Topic 01: 학습 패러다임과 수리적 최적화 (Learning & Optimization)

  • Why to Learn: 기계가 정답을 찾아가는 수치적 과정을 이해하여 모델의 학습 실패 원인을 과학적으로 분석하기 위함입니다.
  • What to Learn:
    • Concepts: 지도 학습 vs 비지도 학습, 손실 함수(MSE, Cross-Entropy), 경사 하강법, 과적합(Overfitting).
    • Skills: 가중치 업데이트 수리 모델 이해, 학습 곡선(Learning Curve) 분석을 통한 모델 상태 진단.
    • Tools: Scikit-learn, NumPy (텐서 기초), Jupyter.
    • Trade-offs: 모델의 표현력(Bias) vs 데이터에 대한 민감도(Variance) 조율.
  • How to Learn:
    • 1단계: 선형 회귀 모델의 가중치가 미분 연산을 통해 어떻게 스스로 수정되는지 단계별로 추적해 봅니다.
    • 2단계: 동일한 데이터를 더 복잡한 모델에 넣었을 때 일반화 성능이 왜 떨어지는지 실험 데이터를 통해 확인합니다.
  • Implement: 특정 도메인 데이터의 예측 성능을 측정하고 최적화 지점을 도출한 모델 벤치마크 리포트.

Core Topic 02: 딥러닝 아키텍처와 트랜스포머 (Deep Learning & Transformer)

  • Why to Learn: 이미지, 텍스트 등 비정형 데이터에 숨겨진 고차원 문맥을 정밀하게 추출하고 처리하기 위함입니다.
  • What to Learn:
    • Concepts: 활성화 함수(ReLU, Softmax), Attention Mechanism, Transformer(Encoder-Decoder), 가중치 정규화.
    • Skills: 레이어별 특징 맵(Feature Map) 분석, 어텐션 스코어 시각화를 통한 모델의 주목 영역 식별.
    • Tools: PyTorch, TensorFlow, Weights & Biases (실험 관리).
    • Trade-offs: 모델 파라미터 수(지능 수준) vs 학습 및 추론 연산 비용(Hardware 리소스).
  • How to Learn:
    • 1단계: PyTorch로 직접 간단한 신경망을 구축하고 학습 루프를 개발하여 손실값이 수렴하는 과정을 관찰합니다.
    • 2단계: Self-Attention 연산이 문장 내 단어 간의 관계를 어떻게 수치적으로 벡터화하는지 직접 계산해 봅니다.
  • Implement: 이미지 분류 혹은 텍스트 요약 태스크를 수행하는 딥러닝 신경망 모듈 및 실험 환경.

Practical

Core Topic 03: 거대 언어 모델 응용과 지식 증강 (LLM & RAG Engineering)

  • Why to Learn: 모델을 처음부터 학습시키는 막대한 비용 대신, 기존의 거대 지능을 도메인 지식과 결합해 실질적 가치를 창출하기 위함입니다.
  • What to Learn:
    • Concepts: In-context Learning, 벡터 임베딩, RAG(분산 지식 검색), 에이전트 추론 루프(ReAct).
    • Skills: 할루시네이션 제어를 위한 프롬프트 가드레일 설계, 벡터 DB를 이용한 의미 기반 검색 고도화.
    • Tools: Hugging Face, LangChain, Pinecone/Milvus (Vector DB).
    • Trade-offs: 실시간 검색 정보 반영(RAG) vs 정교한 태스크 적응(Fine-tuning).
  • How to Learn:
    • 1단계: 사내 위키 혹은 기술 문서를 PDF로 읽어 들여 벡터 DB에 저장하고, AI가 해당 문서를 참고해 답변하게 만듭니다.
    • 2단계: AI 답변의 정확도를 정량적으로 평가하기 위한 평가 데이터셋(Eval set)을 구축하고 메트릭을 측정합니다.
  • Implement: 외부 지식 베이스와 연동되어 실무 질문에 정확히 답변하는 RAG 서비스 파이프라인.

Advanced

Core Topic 04: AI 운영 체계와 지속적 지능 (MLOps & Continuous Intelligence)

  • Why to Learn: 배포된 AI 모델이 시간이 흐름에 따라 변화하는 현실 데이터에 적응하지 못하고 퇴화하는 것을 방지하기 위함입니다.
  • What to Learn:
    • Concepts: 데이터 드리프트(Data Drift), 모델 서빙 가용성, 자동화된 재학습 파이프라인, 모델 양자화(Quantization).
    • Skills: 추론 지연 시간(Latency) 최소화 설계, 모델 버전 관리 및 A/B 테스팅 배포.
    • Tools: MLflow, Kubeflow, BentoML, Triton Inference Server.
    • Trade-offs: 상시 재학습의 정확도 vs 서버 인프라 유지 비용 및 연산 자원 관리.
  • How to Learn:
    • 1단계: 신규 데이터가 유입되면 자동으로 학습 데이터를 생성하고 모델 성능을 검증하는 CI/CD를 구성합니다.
    • 2단계: 운영 중인 모델의 입력값 분포 변화를 감지하여 알람을 발생시키는 모니터링 환경을 실습합니다.
  • Implement: 데이터 유입부터 모델 배포까지의 전 과정을 자동화한 지능형 서비스 파이프라인 명세서.

7. Terminology

Term (EN / ko, abbr) 1문장 정의 단계(기본/권장/실무/심화) 역할/맥락 관련 개념 유사/대비/함께 사용 오해 포인트 Evidence(Primary/Secondary/Industry) Flags(core)
Gradient Descent 손실 함수의 최솟값을 찾기 위해 기울기가 낮아지는 방향으로 가중치를 조금씩 조절하는 최적화 기법입니다. 기본 수학적 기하 Loss Function vs. Adam, RMSprop 단순히 숫자를 뺄셈하는 과정으로만 협소하게 오해함 Primary core
Attention Mechanism 입력 데이터의 여러 부분 중 결과 도출에 결정적인 영향을 주는 요소에 더 큰 가중치를 부여하는 연산 방식입니다. 권장 특징 추출 Transformer vs. RNN, CNN 모든 데이터에 골고루 집중하는 것과 혼동함 Industry core
RAG (Retrieval-Augment) 사전에 학습되지 않은 외부 지식을 검색하여 AI가 답변을 생성할 때 참고하게 만드는 증강 기술입니다. 실무 지식 확장 Vector DB vs. Fine-tuning 모델의 내부 가중치를 직접 바꾼다고 착각함 Industry, Facebook core
Data Drift 시간이 지남에 따라 실제 유입되는 데이터의 통계적 속성이 학습 시점과 달라져 모델 성능이 하락하는 현상입니다. 심화 품질 관리 Concept Drift MLOps 단순히 데이터 양이 부족해지는 상태로 오해함 Primary core

8. References

Primary References

  • [P1] CS2023: AI — Artificial Intelligence & Machine Learning Knowledge Areas.
  • [P4] DS-BoK — Data Science Body of Knowledge (Statistical Modeling).
  • [P5] SFIA v9: METL — 머신러닝 개발 및 AI 워크로드를 위한 기술 역량 정의.

Secondary References

  • [Hands-on Machine Learning] Aurélien Géron — 실습 중심의 현대 ML/DL 프레임워크 바이블.
  • [Deep Learning] Ian Goodfellow — 딥러닝 이론의 수학적 근간을 정리한 원전.

Industry References

  • [Google Cloud] ML Architecture Center — 엔터프라이즈 레벨의 AI 인프라 및 서빙 설계 가이드.
  • [Hugging Face] Documentation — 현대 오픈소스 AI 커뮤니티의 사실상 기술 표준 매뉴얼.

9. Final Checklist

Primary Checklist

  • 특정 비즈니스 도메인 문제를 해결하기 위해 지도/비지도/강화 학습 중 가장 적합한 학습 구조를 정의했는가? (P1)
  • 데이터 수집 및 전처리 과정에서 발생할 수 있는 편향(Bias)을 식별하고 이를 보정할 전략이 있는가? (P4)

Secondary Checklist

  • 모델의 손실 함수(Loss Function)와 비지니스 성과 지표(Metric)가 상호 정렬(Alignment)되어 있는가?
  • 딥러닝 모델 설계 시 신경망 아키텍처의 연산 복잡도와 추론 지연 시간(Latency) 사이의 균형을 고려했는가?

Industry Checklist

  • 실서비스 배포 후 주기적인 모니터링을 통해 데이터 드리프트 감지 시 재학습을 수행할 파이프라인이 있는가?
  • 생성형 AI 도입 시 개인정보 유출 방지 레이어(Privacy Layer)와 모델 윤리 가이드라인을 준수하고 있는가?