Prompt Engineering & RAG Mechanics
고정된 모델의 지능을 자연어 명령으로 물리적 유도(Prompting)하고, 외부의 수치화된 정보를 실시간으로 결합(RAG)하여 모델의 지식적 한계를 수리적으로 돌파하는 기법을 다룹니다.
sys.entry
M
Me
hyunyoun's Blog
posts7 min read
1. Overview
프롬프트 공학 및 RAG 역학(Prompt Engineering & RAG Mechanics, PRM)은 이미 학습이 완료된 거대 모델을 하드웨어적으로 재학습시키지 않고도, 정교한 입력 수치 조절과 외부 데이터의 수리적 수혈을 통해 지능의 출력을 물리적으로 제어하는 '적응형 지능 인터페이스 물리학'입니다.
학습자는 모델의 사고 수순을 수치적으로 가이드하는 **프롬프트 기법(CoT 등)**의 물리적 원리와, 방대한 문서 정보를 수리 벡터로 구워 실시간으로 찾는 **RAG(Retrieval-Augmented Generation)**의 시퀀스를 배웁니다. 특히, 모델의 수리적 기억 장벽인 컨텍스트 윈도우(Context Window) 수치를 효율적으로 활용하는 물리적 전략을 익힙니다. 이를 통해 모델의 '환각()'을 수치적으로 억제하고 신뢰할 수 있는 하이엔드 AI 서비스를 구현하는 거버넌스 역량을 확보합니다.
2. Scope & Boundaries
In-Scope
- Prompting Paradigms: Zero-shot, Few-shot, Chain-of-Thought 등 수리적 출력 유도 수순
- Vector Search Dynamics: 문서 조각을 수치 벡터로 변환하여 물리적으로 가장 유사한 것을 찾는 기제
- RAG Pipeline: 문서 파싱 -> 수리 임베딩 -> 벡터 스토어 스캔 -> 컨텍스트 주입의 물리 파이프라인
- Augmentation Tactics: 검색된 정보를 프롬프트의 어느 수리적 위치에 물리 배치할지에 대한 전략
- Validation Metrics: 모델의 응답이 원본 수치 근거와 물리적으로 일치하는지 측정하는 수리 지표
Out-of-Scope
- 모델의 내부 가중치()를 직접 수정하는 학습 공정 (11-03-03 FTMA 영역에서 분담)
- 임베딩 모델 자체의 신경망 아키텍처 설계 (11-03-01 LTP 영역에서 분담)
Boundaries
- PRM vs. Knowledge Base: 일반 DB 검색이 키워드 매칭에 집중한다면, PRM의 RAG는 '의미의 수리적 거리'를 기반으로 하드웨어가 맥락에 맞는 정보를 직접 '읽고 해석'하게 만든다는 점에 집중하여 구분합니다.
3. Counterexample
- 단순히 "명령어를 잘 쓰는 법"이라 설명하는 것은 PRM 학습이 아닙니다. 왜 프롬프트의 토큰 순서 수치가 수리적으로 중요하며, RAG에서 문서의 분할 물리 단위(Chunk Size)를 잘못 설정하면 모델이 핵심 정보를 수치적으로 왜곡하여 왜 더 위험한 '확률적 거짓말'을 내놓는지 논증하지 못한다면 적응형 지능의 본질을 이해하지 못한 것입니다.
4. Prerequisites
- LLM Foundations & Token Physics (Basic): 11-03-01의 토큰화 및 임베딩 수치 이해가 필수입니다.
- Modern Transformer Architectures (Basic): 11-02-04의 셀프 어텐션 및 문맥 가중치 이해가 필수입니다.
5. Learning Map
- Thinking in Prompts: 자연어를 모델이 선호하는 수리적 가이드라인으로 물리 설계하는 법을 배웁니다.
- External Memory: 모델 외부에 거대한 수치 지식 창고(Vector DB)를 물리적으로 탄설합니다.
- Retrieval Sync: 현재의 질문과 외부의 수치를 실시간으로 수리 동기화하여 지능의 범위를 확장합니다.
- Verifiably Intelligent: 출처가 수치적으로 보증된 정보를 뱉어내는 하이엔드 신뢰 서비스를 완성합니다.
6. Learning Topics
Basic
Core: 프롬프트 패턴과 소수샷 학습 (Prompt Physics)
- Why to Learn: 모델을 재학습시키지 않고도 입력 수치 조정만으로 하드웨어의 결과물 수준을 물리적으로 폭증시키기 위해서입니다.
- What to Learn:
- Instruction Prompting: 작업의 수리적 수순을 명확한 물리 단계로 지시하는 법
- Few-shot Learning: 예시 수치를 몇 개 주입하여 모델의 수리적 기대를 물리 조정하는 기제
- Negative Prompting: 모델이 생성하지 말아야 할 수리 영역을 물리적으로 봉인하는 법
- How to Learn:
- 동일한 질문에 대해 예시(Example) 수치를 0개에서 5개로 늘려보며 모델의 물리적 적응력 수치 확인 실습
- 프롬프트 끝에 "단계적으로 생각하라"는 수리적 마법의 문장을 넣었을 때 하드웨어 추론 성능의 물리적 도약 분석 훈련
- Implement: 다양한 프롬프트 조합을 실험하고 결과 수치를 로깅하는 기초
PromptTester
Recommended
Core: RAG의 수리적 시퀀스와 텍스트 분할 (Retrieval Dynamics)
- Why to Learn: 모델이 학습하지 않은 어제의 뉴스나 기업 내부의 기밀 수치를 물리적으로 다루게 하기 위함입니다.
- What to Learn:
- Text Chunking: 방대한 문서를 하드웨어가 읽기 적절한 수치 조각(Chunk)으로 물리 분할
- Vector Embed-Store: 조각된 수치를 고차원 벡터로 구워 하드웨어 데이터베이스에 물리 적재
- Retrieval Logic: 질문의 수치 벡터와 가장 인접한 문서 조각을 물리적으로 선발
- How to Learn:
- PDF 매뉴얼을 수치화하여 벡터 DB에 넣고, 하드웨어가 페이지 번호까지 정확히 수리 참조하여 답하는 과정 확인 실습
- 청크 사이즈(Chunk Size) 수치를 바꿔보며, 검색 결과의 물리적 정교함이 수리적으로 어떻게 요동치는지 연구
- Implement: 문서를 정해진 토큰 수치 단위로 쪼개는 물리 분할기
DocumentSplitter
Practical
Core: 벡터 DB 및 의미 검색 (Vector Search Ops)
- Why to Learn: 수조 개의 문서 정보 속에서 0.1초 만에 물리적으로 관련 있는 수치 데이터를 추출하기 위해서입니다.
- What to Learn:
- Similarity Metrics (L2, Inner Product): 벡터 간의 물리적 거리를 계산하는 수리 기준
- Indexing (HNSW, IVFPQ): 수치 검색 속도를 기하급수적으로 높이는 물리적 인덱스 구조
- Hybrid Search: 수리적 의미(Dense)와 키워드 빈도(Sparse)를 물리적으로 결합하는 법
- How to Learn:
Pinecone이나Chroma를 사용하여 만 단위의 벡터 정보를 물리 스캔하고 수리적 재현율()을 측정하는 실습- 수천 차원의 벡터 수치를 **양자화(Quantization)**하여 검색 하드웨어의 메모리 수치를 절약하는 물리 최적화
- Implement: 벡터 사이의 수리적 최단 경로를 검색하는 기초
Vector_Navigator
Advanced
Core: 고급 사고 기법과 RAG 평가 (Advanced Reasoning)
- Why to Learn: 복잡한 다단계 하드웨어 문제를 풀고, 생성된 지능의 수리적 결함을 물리적으로 자동 검증하기 위함입니다.
- What to Learn:
- Chain-of-Thought (CoT): 모델이 중간 수리 과정을 물리적으로 기술하게 하여 논리 완성
- ReAct: 모델이 외부 도구나 검색 수치를 스스로 물리 사용하여 문제를 푸는 역학
- RAG Evaluation (RAGAS): 검색 수치의 물리적 적합성과 생성의 수리적 충실도를 수치 정량화
- How to Learn:
- 여러 하드웨어 가이드를 종합해야 풀 수 있는 복잡한 시나리오에서 모델의 사고 사슬 수치 오류 분석 실습
- 모델의 답변이 원문 수치 데이터에서 '탈선'했는지 자동 검사하는 물리적 '정답기()' 시스템 구축
- Implement: 사고 과정을 기록하고 최종 수리 해를 도출하는
Reasoning_Engine
7. Terminology
8. References
Primary
- [P1] CS2023 - Artificial Intelligence (AI) - Knowledge Retrieval & Interaction — Academic curricula.
- [P4] DS-BoK (EDSF) - Data Analytics / Contextual Interaction — Definition of interaction skills.
Secondary
- [Building LLM Applications] Various - Design patterns for RAG and Prompting.
- [DeepLearning.AI: Prompt Engineering for Developers] — Practical course on interaction physics.
Industry
- [LangChain Documentation: RAG and Concepts] — The standard implementation framework.
- [LlamaIndex Documentation: Data Connectors] — Advanced retrieval strategies.
9. Final Checklist
Primary
- '컨텍스트 윈도우'의 물리적 한계 수치가 모델의 '기억 누락' 현상에 미치는 수리적 영향을 설명 가능한가? (P4)
- '의미 검색' 시 도출된 '유사도 점수' 수치가 생성물에 대한 모델의 물리적 확신도와 어떤 상관관계를 갖는지 기술할 수 있는 가? (P1)
Secondary
- '파인튜닝' 대비 'RAG'가 실시간 하드웨어 지식 업데이트 비용 수치를 물리적으로 얼마나 절감하는지 소통 가능한가?
- Chain-of-Thought 적용 시 모델의 수리적 '중간 연산 토큰' 비용이 물리적 정확도 대비 효율적인지 논증할 수 있는 가?
Industry
- 실무 서비스에서 재발하는 '환각' 수치를 줄이기 위해 어떤 RAG 파이프라인의 물리 수치를 보정할지 제안할 수 있는 가? (SFIA)
- 여러 벡터 데이터베이스 하드웨어의 인덱싱(Indexing) 속도와 수리 정합성(Precision) 수치를 대조 분석할 수 있는 가?