콘텐츠로 바로가기

LLM Fine-Tuning & Alignment

사전 학습된 LLM의 행동을 특정 도메인이나 인간 선호도에 맞게 추가 조정하는 기법. 1. SFT (지도 학습 미세 조정) 2. 보상 모델 학습 (인간 선호도 쌍 비교) 3. PPO로 보상 최대화

sys.entry
M

Me

hyunyoun's Blog

machine-learning-ai1 min read

LLM Fine-Tuning & Alignment

사전 학습된 LLM의 행동을 특정 도메인이나 인간 선호도에 맞게 추가 조정하는 기법.

기법 분류

Full Fine-Tuning: 모델 전체 파라미터를 추가 학습. 성능 최고, 연산 비용 최고.

PEFT (Parameter-Efficient Fine-Tuning): 소수 파라미터만 학습.

  • LoRA: 가중치 행렬의 저순위 분해(Low-Rank Decomposition)로 작은 어댑터만 학습. 원본 파라미터 동결.
  • Prefix Tuning: 입력 앞에 학습 가능한 가상 토큰 삽입.

RLHF (Reinforcement Learning from Human Feedback):

  1. SFT (지도 학습 미세 조정)
  2. 보상 모델 학습 (인간 선호도 쌍 비교)
  3. PPO로 보상 최대화

RAG vs Fine-Tuning 선택

시나리오 선택
최신 정보 지속 업데이트 RAG
특정 문체/형식 고정 Fine-Tuning
도메인 전문 용어 내재화 Fine-Tuning
소량 데이터, 빠른 실험 RAG

연결 노트