Machine Learning & AI
통계적 수학과 대규모 하드웨어 연산을 결합하여 기계가 스스로 규칙을 추출하고, 인간의 고등 추론을 수리적으로 모사하는 인공지능의 모든 계층을 다룹니다.
sys.entry
M
Me
hyunyoun's Blog
posts7 min read
1. Overview
기계 학습 및 인공지능(Machine Learning & AI, MAI)은 데이터 속에 숨겨진 고차원적 패턴을 수리적으로 포착하고, 이를 기반으로 예측, 생성, 추론을 수행하는 '지능의 디지털 공학'입니다. 본 카테고리는 통계학적 기초부터 현대의 거대 언어 모델(LLM), 그리고 이를 실제 워크로드에서 가동하는 운영 체계(MLOps)까지의 전 과정을 다룹니다.
CS2023의 Artificial Intelligence (AI) 지식 영역과 DS-BoK(Data Science Body of Knowledge)을 근간으로 삼아, 단순한 모델 학습을 넘어 실제 비즈니스 가치를 창출하기 위한 최적의 지능형 아키텍처와 엔지니어링 패러다임을 탐구합니다.
2. Scope & Boundaries
In-Scope
- ML 기초 및 알고리즘: 지도/비지도/강화 학습의 학습 체계, 결정 트리 및 앙상블 기법.
- 딥러닝 아키텍처: CNN(시각), RNN(시계열), Transformer(문맥), Diffusion(생성)의 연산 기전.
- 자연어 처리 및 LLM: Prompt Engineering, RAG(Retrieval-Augmented Generation), 파인튜닝 전략.
- AI 시스템 엔지니어링: MLOps 파이프라인, 모델 압축/양자화, 서빙 인프라 최적화.
Out-of-Scope
- 순수 통계학 이론: 모델링과 무관한 고수준의 확률 통계 증명 (01. MATL 노드로 위임).
- 데이터베이스 내부 커널: 학습 데이터 저장소의 물리적 입출력 최적화 (06. DIM 노드로 위임).
- 일반 웹 서비스 비즈니스: AI 추론과 무관한 일반적인 백엔드 서버 로직 (14. Web 노드로 위임).
Boundaries
- MAI는 단순한 '코드 구현'보다 **'데이터 분포로부터의 일반화 성능'**과 **'추론 결과의 수리적 신뢰도 및 해석 가능성'**을 입체적으로 관리하는 것에 집중합니다.
3. Counterexample
- 단순 API 및 라이브러리 호출: OpenAI API 응답을 파싱하거나 Scikit-learn 함수 하나를 호출하는 것은 활용 단계입니다. 왜 특정 입력에서 **할루시네이션(Hallucination)**이 발생하는지, 혹은 경사 소실(Vanishing Gradient) 문제를 해결하기 위해 어떤 정규화(Normalization) 기법이 적용되는지 원리를 분석해야 합니다.
- 하이퍼파라미터 무작위 대입: "그냥 성능이 좋아서" 값을 바꾸는 것은 공학이 아닙니다. 손실 함수(Loss Function)의 곡률과 경사 하강법(Gradient Descent)의 학습률(Learning Rate) 스케줄링이 모델의 수렴 속도에 미치는 영향을 수학적으로 해석할 수 있어야 합니다.
4. Prerequisites
- 수학적 기초 (Basic): 미적분(편미분), 선형대수(행렬 공식), 통계학적 가설 검정과 확률 분포 이해. (P1
) - 자료구조 및 알고리즘 (Recommended): 대규모 텐서(Tensor) 연산을 위한 다차원 배열 구조 및 복잡도 분석. (P1
) - 컴퓨터 구조 (Practical): GPU/NPU 가속 원리 및 메모리 대역폭이 학습 성능에 미치는 영향 이해. (P1
)
5. Learning Map
- Statistical Learning: 데이터로부터 유의미한 패턴을 추출하는 확률론적 기초와 회귀/분류 원리를 다집니다. (P4
) - Neural Mechanisms: 다층 신경망을 통한 비선형 특징 추출(Feature Extraction)과 역전파 알고리즘을 익힙니다. (P1
) - Foundation Models: Transformer 구조와 사전 학습(Pre-training)을 통한 거대 지능 모델의 생성 원리를 배웁니다.
- Agentic Engineering: 학습된 모델을 실제 서비스에 이식하고 지능적인 워크플로우를 자동화하는 MLOps 체계를 구축합니다. (P5
)
6. Learning Topics
Basic
Core Topic 01: 학습 패러다임과 수리적 최적화 (Learning & Optimization)
- Why to Learn: 기계가 정답을 찾아가는 수치적 과정을 이해하여 모델의 학습 실패 원인을 과학적으로 분석하기 위함입니다.
- What to Learn:
- Concepts: 지도 학습 vs 비지도 학습, 손실 함수(MSE, Cross-Entropy), 경사 하강법, 과적합(Overfitting).
- Skills: 가중치 업데이트 수리 모델 이해, 학습 곡선(Learning Curve) 분석을 통한 모델 상태 진단.
- Tools: Scikit-learn, NumPy (텐서 기초), Jupyter.
- Trade-offs: 모델의 표현력(Bias) vs 데이터에 대한 민감도(Variance) 조율.
- How to Learn:
- 1단계: 선형 회귀 모델의 가중치가 미분 연산을 통해 어떻게 스스로 수정되는지 단계별로 추적해 봅니다.
- 2단계: 동일한 데이터를 더 복잡한 모델에 넣었을 때 일반화 성능이 왜 떨어지는지 실험 데이터를 통해 확인합니다.
- Implement: 특정 도메인 데이터의 예측 성능을 측정하고 최적화 지점을 도출한 모델 벤치마크 리포트.
Recommended
Core Topic 02: 딥러닝 아키텍처와 트랜스포머 (Deep Learning & Transformer)
- Why to Learn: 이미지, 텍스트 등 비정형 데이터에 숨겨진 고차원 문맥을 정밀하게 추출하고 처리하기 위함입니다.
- What to Learn:
- Concepts: 활성화 함수(ReLU, Softmax), Attention Mechanism, Transformer(Encoder-Decoder), 가중치 정규화.
- Skills: 레이어별 특징 맵(Feature Map) 분석, 어텐션 스코어 시각화를 통한 모델의 주목 영역 식별.
- Tools: PyTorch, TensorFlow, Weights & Biases (실험 관리).
- Trade-offs: 모델 파라미터 수(지능 수준) vs 학습 및 추론 연산 비용(Hardware 리소스).
- How to Learn:
- 1단계: PyTorch로 직접 간단한 신경망을 구축하고 학습 루프를 개발하여 손실값이 수렴하는 과정을 관찰합니다.
- 2단계: Self-Attention 연산이 문장 내 단어 간의 관계를 어떻게 수치적으로 벡터화하는지 직접 계산해 봅니다.
- Implement: 이미지 분류 혹은 텍스트 요약 태스크를 수행하는 딥러닝 신경망 모듈 및 실험 환경.
Practical
Core Topic 03: 거대 언어 모델 응용과 지식 증강 (LLM & RAG Engineering)
- Why to Learn: 모델을 처음부터 학습시키는 막대한 비용 대신, 기존의 거대 지능을 도메인 지식과 결합해 실질적 가치를 창출하기 위함입니다.
- What to Learn:
- Concepts: In-context Learning, 벡터 임베딩, RAG(분산 지식 검색), 에이전트 추론 루프(ReAct).
- Skills: 할루시네이션 제어를 위한 프롬프트 가드레일 설계, 벡터 DB를 이용한 의미 기반 검색 고도화.
- Tools: Hugging Face, LangChain, Pinecone/Milvus (Vector DB).
- Trade-offs: 실시간 검색 정보 반영(RAG) vs 정교한 태스크 적응(Fine-tuning).
- How to Learn:
- 1단계: 사내 위키 혹은 기술 문서를 PDF로 읽어 들여 벡터 DB에 저장하고, AI가 해당 문서를 참고해 답변하게 만듭니다.
- 2단계: AI 답변의 정확도를 정량적으로 평가하기 위한 평가 데이터셋(Eval set)을 구축하고 메트릭을 측정합니다.
- Implement: 외부 지식 베이스와 연동되어 실무 질문에 정확히 답변하는 RAG 서비스 파이프라인.
Advanced
Core Topic 04: AI 운영 체계와 지속적 지능 (MLOps & Continuous Intelligence)
- Why to Learn: 배포된 AI 모델이 시간이 흐름에 따라 변화하는 현실 데이터에 적응하지 못하고 퇴화하는 것을 방지하기 위함입니다.
- What to Learn:
- Concepts: 데이터 드리프트(Data Drift), 모델 서빙 가용성, 자동화된 재학습 파이프라인, 모델 양자화(Quantization).
- Skills: 추론 지연 시간(Latency) 최소화 설계, 모델 버전 관리 및 A/B 테스팅 배포.
- Tools: MLflow, Kubeflow, BentoML, Triton Inference Server.
- Trade-offs: 상시 재학습의 정확도 vs 서버 인프라 유지 비용 및 연산 자원 관리.
- How to Learn:
- 1단계: 신규 데이터가 유입되면 자동으로 학습 데이터를 생성하고 모델 성능을 검증하는 CI/CD를 구성합니다.
- 2단계: 운영 중인 모델의 입력값 분포 변화를 감지하여 알람을 발생시키는 모니터링 환경을 실습합니다.
- Implement: 데이터 유입부터 모델 배포까지의 전 과정을 자동화한 지능형 서비스 파이프라인 명세서.
7. Terminology
8. References
Primary References
- [P1] CS2023: AI — Artificial Intelligence & Machine Learning Knowledge Areas.
- [P4] DS-BoK — Data Science Body of Knowledge (Statistical Modeling).
- [P5] SFIA v9: METL — 머신러닝 개발 및 AI 워크로드를 위한 기술 역량 정의.
Secondary References
- [Hands-on Machine Learning] Aurélien Géron — 실습 중심의 현대 ML/DL 프레임워크 바이블.
- [Deep Learning] Ian Goodfellow — 딥러닝 이론의 수학적 근간을 정리한 원전.
Industry References
- [Google Cloud] ML Architecture Center — 엔터프라이즈 레벨의 AI 인프라 및 서빙 설계 가이드.
- [Hugging Face] Documentation — 현대 오픈소스 AI 커뮤니티의 사실상 기술 표준 매뉴얼.
9. Final Checklist
Primary Checklist
- 특정 비즈니스 도메인 문제를 해결하기 위해 지도/비지도/강화 학습 중 가장 적합한 학습 구조를 정의했는가? (P1)
- 데이터 수집 및 전처리 과정에서 발생할 수 있는 편향(Bias)을 식별하고 이를 보정할 전략이 있는가? (P4)
Secondary Checklist
- 모델의 손실 함수(Loss Function)와 비지니스 성과 지표(Metric)가 상호 정렬(Alignment)되어 있는가?
- 딥러닝 모델 설계 시 신경망 아키텍처의 연산 복잡도와 추론 지연 시간(Latency) 사이의 균형을 고려했는가?
Industry Checklist
- 실서비스 배포 후 주기적인 모니터링을 통해 데이터 드리프트 감지 시 재학습을 수행할 파이프라인이 있는가?
- 생성형 AI 도입 시 개인정보 유출 방지 레이어(Privacy Layer)와 모델 윤리 가이드라인을 준수하고 있는가?