Machine Learning & AI

1. Overview

기계 학습 및 인공지능(Machine Learning & AI, MAI)은 데이터 속에 숨겨진 고차원적 패턴을 수리적으로 포착하고, 이를 기반으로 예측, 추론, 생성을 수행하는 '지능의 디지털 공학'입니다. 본 카테고리는 통계학적 기초부터 현대의 거대 언어 모델(LLM), 비전(Vision) 및 다중 모달(Multimodal) 기술, 그리고 이를 실제 프로덕션 환경에서 가동하는 운영 체계(MLOps/LLMOps)까지의 전 과정을 다룹니다.

CS2023의 Artificial Intelligence (AI) 지식 영역과 DS-BoK(Data Science Body of Knowledge)을 근간으로 삼아, 단순한 모델 학습을 넘어 실제 비즈니스 가치를 창출하기 위한 최적의 지능형 아키텍처와 엔지니어링 패러다임을 탐구합니다.

과거의 AI가 분류(Classification)와 예측(Prediction) 위주의 식별형 AI(Discriminative AI)에 머물렀다면, 현대의 AI는 방대한 사전 학습(Pre-training) 모델을 기반으로 새로운 콘텐츠를 만들어내는 생성형 AI(Generative AI) 시대로 접어들었습니다. 따라서 본 영역은 밑바닥부터 모델을 학습시키는 연구적 관점과 함께, 파운데이션 모델(Foundation Models)을 가져와 RAG(검색 증강 생성)나 프롬프트 엔지니어링으로 빠르고 안전하게 비즈니스에 적용하는 '응용 AI 엔지니어링' 관점을 비중 있게 다룹니다.

2. Scope & Boundaries

In-Scope

ML 기초 및 알고리즘: 지도/비지도/강화 학습 체계, 결정 트리, 랜덤 포레스트(Random Forest), 부스팅(XGBoost, LightGBM) 등의 앙상블 기법.
딥러닝 아키텍처: CNN(시각 특징 추출), RNN/LSTM(순차 데이터), Transformer(어텐션 메커니즘 기반 문맥 이해), Diffusion(이미지 생성) 연산 기전.
자연어 처리 및 생성형 AI: LLM(거대 언어 모델) 구조, 프롬프트 엔지니어링(Prompt Engineering), 파인튜닝(LoRA, PEFT), RAG(Retrieval-Augmented Generation).
AI 시스템 엔지니어링(MLOps): 모델 서빙 인프라 최적화, 모델 압축 및 양자화(Quantization), 데이터/모델 드리프트(Drift) 모니터링, AI 윤리 및 환각(Hallucination) 통제.

Out-of-Scope

순수 수학 및 통계학 이론 증명: 모델링과 직접적 연관이 적은 고차원 해석학이나 확률 통계의 순수 수학적 증명 → 01. MATL 노드로 위임.
데이터베이스 물리 커널 구조: 대용량 학습 데이터를 저장하는 분산 데이터베이스의 디스크 I/O 최적화 수준의 상세 내용 → 06. DIM 노드로 위임.
일반 비즈니스 백엔드 시스템: AI 모델 추론 파이프라인과 무관한 일반적인 웹 서버 로직 및 결제 시스템 구축 → 14. Web 노드로 위임.

Boundaries

MAI는 단순한 'Python 코드 구현'보다 **'데이터 분포로부터 모델이 얼마나 잘 일반화(Generalization)되는가'**와 **'추론 결과의 수리적 신뢰도 및 해석 가능성(Explainability)'**을 입체적으로 관리하는 것에 집중합니다.
DIM(06)이 '데이터를 어떻게 잘 수집, 정제, 적재할 것인가'를 다룬다면, MAI는 '그 적재된 데이터에서 어떻게 지능(결정 및 패턴)을 추출할 것인가'를 다룹니다.

3. Counterexample

단순 API 및 라이브러리 호출 복사: OpenAI API 응답을 파싱하거나 Scikit-learn의 fit() 함수 하나를 맹목적으로 호출하는 것은 활용 단계일 뿐입니다. 왜 특정 입력에서 **환각(Hallucination)**이 발생하는지 원인을 분석하고, 경사 소실(Vanishing Gradient) 문제를 해결하기 위해 왜 정규화(Normalization) 기법이나 Residual Connection이 도입되었는지 연산 구조를 설명할 수 있어야 합니다.
하이퍼파라미터 무작위 대입(Grid Search): "그냥 이것저것 넣어보니 성능이 좋아서" 값을 고르는 것은 공학적 접근이 아닙니다. 손실 함수(Loss Function)의 곡률(Curvature)과 학습률(Learning Rate) 스케줄링이 모델의 전역 최적점(Global Minima) 도달에 미치는 영향을 최적화 알고리즘 관점에서 해석해야 합니다.
비용을 무시한 무조건적인 초거대 모델 도입: 단순한 텍스트 분류 작업에 수십 억 파라미터의 LLM을 배포하는 것은 낭비입니다. 비즈니스 요구사항과 레이턴시 제약에 맞춰 초경량화된 결정 트리 모델이 더 유리한 상황을 판단하는 것이 진정한 엔지니어링입니다.

4. Prerequisites

수학적 기초 (Basic): 미적분(편미분, Chain Rule), 선형대수(행렬 곱연산, 고유벡터), 통계학(확률 분포, 베이즈 정리) 지식이 알고리즘 동작 원리 이해의 필수 뼈대입니다. (P1)
자료구조 및 알고리즘 (Recommended): 대규모 텐서(Tensor) 연산을 위한 다차원 배열 메모리 구조 파악 및 알고리즘의 공간/시간 복잡도 분석 능력. (P1)
컴퓨터 구조 (Practical): GPU/NPU 병렬 가속 원리 및 메모리 대역폭(Bandwidth) 병목 현상이 거대 모델 학습/추론 성능에 미치는 영향 이해. (P1)

5. Learning Map

Sequence	Core Cluster	Objective & Description	Evidence (BoK)
1	Statistical Learning & Optimization	지도/비지도 학습의 확률론적 기반을 익히고, 손실 함수와 경사 하강법(Gradient Descent)을 통해 데이터 패턴을 추출하는 수리적 최적화 원리를 이해합니다.	P4
2	Deep Learning & Neural Architectures	다층 신경망의 비선형 특징 추출 및 역전파(Backpropagation) 기전을 학습하고, CNN/RNN 및 트랜스포머(Transformer)의 연산 구조를 파악합니다.	P1
3	LLM Application & RAG Engineering	거대 언어 모델(LLM)의 생성 원리와 파인튜닝 전략을 탐구하며, 벡터 데이터베이스 기반의 검색 증강 생성(RAG)을 통해 도메인 지식을 확장합니다.	Industry
4	MLOps & Continuous Intelligence	데이터 드리프트(Data Drift) 감지, 자동화된 재학습 파이프라인(CI/CD/CT) 등 AI 모델을 실제 프로덕션 환경에서 안정적으로 서비스하기 위한 MLOps 체계를 구축합니다.	P5

6. Learning Topics

Basic

Core Topic 01: 학습 패러다임과 수리적 최적화 (Learning & Optimization)

Why to Learn: 기계가 정답을 찾아가는 수치적 과정을 블랙박스로 두지 않고, 손실 함수의 기하학적 의미를 이해하여 모델의 학습 실패(예: Overfitting, Underfitting) 원인을 과학적으로 분석하기 위함입니다.
What to Learn:
- Concepts: 지도 학습(Supervised) vs 비지도 학습(Unsupervised), 손실 함수(MSE, Cross-Entropy), 경사 하강법(Gradient Descent), 오차 역전파(Backpropagation), 과적합(Overfitting)과 정규화(L1/L2 Regularization).
- Skills: 가중치 업데이트 수리 모델 추적, 학습 곡선(Learning Curve) 분석을 통한 모델 편향-분산 상태 진단, 하이퍼파라미터 튜닝.
- Tools: Scikit-learn, NumPy (다차원 행렬 및 텐서 기초), Pandas, Jupyter Notebook.
- Trade-offs: 모델의 표현력(복잡한 결정 경계 생성) vs 데이터에 대한 민감도(노이즈까지 학습해버리는 분산 문제) 조율 (Bias-Variance Trade-off).
How to Learn:
- 1단계: 선형 회귀(Linear Regression) 모델의 가중치 파라미터가 편미분 연산을 통해 어떻게 기울기가 낮아지는 방향으로 스스로 수정되는지 단계별로 추적 계산해 봅니다.
- 2단계: 동일한 훈련 데이터셋을 결정 트리(Decision Tree)의 깊이(Depth)를 늘려가며 학습시킬 때, 훈련 성능은 올라가지만 검증 데이터(Validation) 성능이 급락하는 과적합 양상을 시각화합니다.
Implement: 특정 도메인 데이터(예: 주택 가격, 환자 암 진단)의 분류/회귀 성능을 측정하고 최적화 지점을 도출한 기초 모델 벤치마크 리포트.

Why to Learn: 이미지, 오디오, 텍스트 등 인간의 언어와 감각에 가까운 비정형(Unstructured) 데이터에 숨겨진 고차원 문맥과 공간적 특징을 정밀하게 추출하고 처리하기 위함입니다.
What to Learn:
- Concepts: 활성화 함수(ReLU, Softmax), CNN(Convolutional Neural Network) 풀링 및 스트라이드, RNN/LSTM 게이트 기전, Attention Mechanism, Transformer(Encoder-Decoder), 가중치 초기화 및 정규화(Batch Norm).
- Skills: 레이어별 특징 맵(Feature Map) 분석, 어텐션 스코어 시각화를 통한 모델의 텍스트 내 주목 영역(Focus) 식별.
- Tools: PyTorch, TensorFlow, Weights & Biases(실험 추적), Hugging Face(모델 아키텍처 분석).
- Trade-offs: 모델의 파라미터 수(지능 수준 및 표현력 극대화) vs 학습 및 추론 시 요구되는 방대한 연산 비용(GPU 메모리 및 전력 리소스).
How to Learn:
- 1단계: PyTorch로 직접 CNN 기반의 간단한 이미지 분류 신경망을 구축하고, 학습 루프(Epoch, Mini-batch)를 스크래치부터 개발하여 손실값이 수렴하는 과정을 추적합니다.
- 2단계: Transformer의 핵심인 Self-Attention 연산 메커니즘을 분석하고, Q, K, V 행렬 곱 연산이 문장 내 단어 간의 연관성을 어떻게 수치적으로 벡터화하는지 추적합니다.
Implement: 특정 이미지 분류(예: 불량품 탐지) 혹은 텍스트 요약 태스크를 수행하는 딥러닝 모듈 구축 및 학습 손실 그래프 대시보드.

Practical

Core Topic 03: 거대 언어 모델 응용과 지식 증강 (LLM & RAG Engineering)

Why to Learn: 수백억 개의 파라미터를 가진 파운데이션 모델을 직접 학습시키는 천문학적 비용을 피하고, 기존의 거대 지능을 사내 도메인 지식과 결합해 즉각적인 비즈니스 가치를 창출하기 위함입니다.
What to Learn:
- Concepts: In-context Learning(Few-shot/Zero-shot), 텍스트 벡터 임베딩(Embedding), RAG(검색 증강 생성), 체인 오브 소트(CoT, Chain-of-Thought), 에이전트 추론 루프(ReAct).
- Skills: 환각(Hallucination) 제어를 위한 프롬프트 가드레일 설계, 임베딩 모델 및 벡터 DB를 이용한 의미 기반 유사도 검색(Semantic Search) 최적화.
- Tools: LangChain, LlamaIndex, OpenAI/Anthropic API, Pinecone/Milvus (Vector DB).
- Trade-offs: 실시간 사내 지식 검색 반영(RAG의 유연성 및 출처 명확성) vs 도메인 특화 어조 및 정교한 태스크 적응(Fine-tuning의 초기 비용 및 데이터셋 확보).
How to Learn:
- 1단계: 사내 위키 혹은 방대한 기술 문서를 PDF로 읽어 들여 청킹(Chunking) 후 벡터 DB에 적재하고, 질문 입력 시 관련된 텍스트 조각을 검색해 프롬프트에 주입하는 기본 RAG 구조를 구현합니다.
- 2단계: RAG 답변의 퀄리티(검색 적합성, 답변 충실도)를 정량적으로 평가하기 위한 Ragas 기반의 평가 데이터셋(Eval set)을 구축하고 메트릭을 추적합니다.
Implement: 외부 폐쇄망 지식 베이스와 연동되어 실무 도메인 질문에 근거를 가지고 정확히 답변하는 기업용 RAG 서비스 파이프라인.

Advanced

Core Topic 04: AI 운영 체계와 지속적 지능 (MLOps & Continuous Intelligence)

Why to Learn: 실험실 쥬피터 노트북에서 성공한 모델이 배포된 이후, 시간이 흐름에 따라 변화하는 현실 데이터 환경(Drift)에 적응하지 못하고 성능이 서서히 퇴화하는 것을 방지하기 위함입니다.
What to Learn:
- Concepts: MLOps 수명 주기, 데이터 드리프트(Data Drift)와 콘셉트 드리프트(Concept Drift), 지속적 재학습(CT, Continuous Training), 모델 압축(양자화/Quantization, Pruning).
- Skills: 고성능 추론 인프라 설계(Batching 최적화), 모델 버전 통제, 무중단 A/B 테스팅 및 섀도우(Shadow) 배포 아키텍처.
- Tools: MLflow(실험 관리), Kubeflow, BentoML, vLLM / Triton Inference Server(추론 가속화).
- Trade-offs: 모델의 상시 재학습에 따른 높은 최신화(정확도 유지) vs 파이프라인 복잡도 증가 및 막대한 GPU 클러스터 컴퓨팅 비용.
How to Learn:
- 1단계: 신규 학습 데이터가 유입되면 파이프라인이 이를 감지하여 모델 훈련, 평가, 컨테이너 빌드, 레지스트리 푸시를 자동으로 수행하는 CI/CD/CT 체계를 구성합니다.
- 2단계: 운영 중인 모델의 입력 데이터(Feature) 분포가 과거 학습 시점과 통계적으로 유의미하게 달라질 경우(Data Drift 감지), 슬랙으로 경고 알람을 발생시키는 모니터링 체계를 실습합니다.
Implement: 데이터 수집부터 피처 스토어, 모델 학습, 서빙 인프라, 모니터링까지 전 과정을 자동화한 엔터프라이즈 지능형 서비스 파이프라인 설계도.

7. Terminology

Term (EN / ko, abbr)	1문장 정의	단계(기본/권장/실무/심화)	역할/맥락	관련 개념	유사/대비/함께 사용	오해 포인트	Evidence(Primary/Secondary/Industry)	Flags(core)
Gradient Descent	손실 함수의 최솟값을 찾기 위해 기울기가 낮아지는 방향으로 가중치를 조금씩 조절하는 최적화 기법입니다.	기본	수학적 기하	Loss Function	vs. Adam, RMSprop	단순히 숫자를 뺄셈하는 과정으로만 협소하게 오해함	Primary	core
Attention Mechanism	입력 데이터의 여러 부분 중 결과 도출에 결정적인 영향을 주는 요소에 더 큰 가중치를 부여하는 연산 방식입니다.	권장	특징 추출	Transformer	vs. RNN, CNN	모든 데이터에 골고루 집중하는 것과 혼동함	Industry	core
RAG (Retrieval-Augment)	사전에 학습되지 않은 외부 지식을 검색하여 AI가 답변을 생성할 때 참고하게 만드는 증강 기술입니다.	실무	지식 확장	Vector DB	vs. Fine-tuning	모델의 내부 가중치를 직접 바꾼다고 착각함	Industry, Facebook	core
Data Drift	시간이 지남에 따라 실제 유입되는 데이터의 통계적 속성이 학습 시점과 달라져 모델 성능이 하락하는 현상입니다.	심화	품질 관리	Concept Drift	MLOps	단순히 데이터 양이 부족해지는 상태로 오해함	Primary	core

8. References

Primary References

[P1] CS2023: AI — Artificial Intelligence & Machine Learning Knowledge Areas.
[P4] DS-BoK — Data Science Body of Knowledge (Statistical Modeling).
[P5] SFIA v9: METL — 머신러닝 개발 및 AI 워크로드를 위한 기술 역량 정의.

Secondary References

[Hands-on Machine Learning] Aurélien Géron — 실습 중심의 현대 ML/DL 프레임워크 바이블.
[Deep Learning] Ian Goodfellow — 딥러닝 이론의 수학적 근간을 정리한 원전.

Industry References

[Google Cloud] ML Architecture Center — 엔터프라이즈 레벨의 AI 인프라 및 서빙 설계 가이드.
[Hugging Face] Documentation — 현대 오픈소스 AI 커뮤니티의 사실상 기술 표준 매뉴얼.

9. Final Checklist

Primary Checklist

특정 비즈니스 도메인 문제를 해결하기 위해 지도/비지도/강화 학습 중 가장 적합한 학습 구조를 정의했는가? (P1)
데이터 수집 및 전처리 과정에서 발생할 수 있는 편향(Bias)을 식별하고 이를 보정할 전략이 있는가? (P4)

Secondary Checklist

모델의 손실 함수(Loss Function)와 비지니스 성과 지표(Metric)가 상호 정렬(Alignment)되어 있는가?
딥러닝 모델 설계 시 신경망 아키텍처의 연산 복잡도와 추론 지연 시간(Latency) 사이의 균형을 고려했는가?

Industry Checklist

실서비스 배포 후 주기적인 모니터링을 통해 데이터 드리프트 감지 시 재학습을 수행할 파이프라인이 있는가?
생성형 AI 도입 시 개인정보 유출 방지 레이어(Privacy Layer)와 모델 윤리 가이드라인을 준수하고 있는가?