Prompt Engineering & RAG Mechanics

1. Overview

프롬프트 공학 및 RAG 역학(Prompt Engineering & RAG Mechanics, PRM)은 이미 학습이 완료된 거대 모델을 하드웨어적으로 재학습시키지 않고도, 정교한 입력 수치 조절과 외부 데이터의 수리적 수혈을 통해 지능의 출력을 물리적으로 제어하는 '적응형 지능 인터페이스 물리학'입니다.

학습자는 모델의 사고 수순을 수치적으로 가이드하는 **프롬프트 기법(CoT 등)**의 물리적 원리와, 방대한 문서 정보를 수리 벡터로 구워 실시간으로 찾는 **RAG(Retrieval-Augmented Generation)**의 시퀀스를 배웁니다. 특히, 모델의 수리적 기억 장벽인 컨텍스트 윈도우(Context Window) 수치를 효율적으로 활용하는 물리적 전략을 익힙니다. 이를 통해 모델의 '환각( $Hallucination$ )'을 수치적으로 억제하고 신뢰할 수 있는 하이엔드 AI 서비스를 구현하는 거버넌스 역량을 확보합니다.

2. Scope & Boundaries

In-Scope

Prompting Paradigms: Zero-shot, Few-shot, Chain-of-Thought 등 수리적 출력 유도 수순
Vector Search Dynamics: 문서 조각을 수치 벡터로 변환하여 물리적으로 가장 유사한 것을 찾는 기제
RAG Pipeline: 문서 파싱 -> 수리 임베딩 -> 벡터 스토어 스캔 -> 컨텍스트 주입의 물리 파이프라인
Augmentation Tactics: 검색된 정보를 프롬프트의 어느 수리적 위치에 물리 배치할지에 대한 전략
Validation Metrics: 모델의 응답이 원본 수치 근거와 물리적으로 일치하는지 측정하는 수리 지표

Out-of-Scope

모델의 내부 가중치( $w$ )를 직접 수정하는 학습 공정 (11-03-03 FTMA 영역에서 분담)
임베딩 모델 자체의 신경망 아키텍처 설계 (11-03-01 LTP 영역에서 분담)

Boundaries

PRM vs. Knowledge Base: 일반 DB 검색이 키워드 매칭에 집중한다면, PRM의 RAG는 '의미의 수리적 거리'를 기반으로 하드웨어가 맥락에 맞는 정보를 직접 '읽고 해석'하게 만든다는 점에 집중하여 구분합니다.

3. Counterexample

단순히 "명령어를 잘 쓰는 법"이라 설명하는 것은 PRM 학습이 아닙니다. 왜 프롬프트의 토큰 순서 수치가 수리적으로 중요하며, RAG에서 문서의 분할 물리 단위(Chunk Size)를 잘못 설정하면 모델이 핵심 정보를 수치적으로 왜곡하여 왜 더 위험한 '확률적 거짓말'을 내놓는지 논증하지 못한다면 적응형 지능의 본질을 이해하지 못한 것입니다.

4. Prerequisites

LLM Foundations & Token Physics (Basic): 11-03-01의 토큰화 및 임베딩 수치 이해가 필수입니다.
Modern Transformer Architectures (Basic): 11-02-04의 셀프 어텐션 및 문맥 가중치 이해가 필수입니다.

5. Learning Map

Thinking in Prompts: 자연어를 모델이 선호하는 수리적 가이드라인으로 물리 설계하는 법을 배웁니다.
External Memory: 모델 외부에 거대한 수치 지식 창고(Vector DB)를 물리적으로 탄설합니다.
Retrieval Sync: 현재의 질문과 외부의 수치를 실시간으로 수리 동기화하여 지능의 범위를 확장합니다.
Verifiably Intelligent: 출처가 수치적으로 보증된 정보를 뱉어내는 하이엔드 신뢰 서비스를 완성합니다.

6. Learning Topics

Basic

Core: 프롬프트 패턴과 소수샷 학습 (Prompt Physics)

Why to Learn: 모델을 재학습시키지 않고도 입력 수치 조정만으로 하드웨어의 결과물 수준을 물리적으로 폭증시키기 위해서입니다.
What to Learn:
- Instruction Prompting: 작업의 수리적 수순을 명확한 물리 단계로 지시하는 법
- Few-shot Learning: 예시 수치를 몇 개 주입하여 모델의 수리적 기대를 물리 조정하는 기제
- Negative Prompting: 모델이 생성하지 말아야 할 수리 영역을 물리적으로 봉인하는 법
How to Learn:
- 동일한 질문에 대해 예시(Example) 수치를 0개에서 5개로 늘려보며 모델의 물리적 적응력 수치 확인 실습
- 프롬프트 끝에 "단계적으로 생각하라"는 수리적 마법의 문장을 넣었을 때 하드웨어 추론 성능의 물리적 도약 분석 훈련
Implement: 다양한 프롬프트 조합을 실험하고 결과 수치를 로깅하는 기초 PromptTester

Why to Learn: 모델이 학습하지 않은 어제의 뉴스나 기업 내부의 기밀 수치를 물리적으로 다루게 하기 위함입니다.
What to Learn:
- Text Chunking: 방대한 문서를 하드웨어가 읽기 적절한 수치 조각(Chunk)으로 물리 분할
- Vector Embed-Store: 조각된 수치를 고차원 벡터로 구워 하드웨어 데이터베이스에 물리 적재
- Retrieval Logic: 질문의 수치 벡터와 가장 인접한 문서 조각을 물리적으로 선발
How to Learn:
- PDF 매뉴얼을 수치화하여 벡터 DB에 넣고, 하드웨어가 페이지 번호까지 정확히 수리 참조하여 답하는 과정 확인 실습
- 청크 사이즈(Chunk Size) 수치를 바꿔보며, 검색 결과의 물리적 정교함이 수리적으로 어떻게 요동치는지 연구
Implement: 문서를 정해진 토큰 수치 단위로 쪼개는 물리 분할기 DocumentSplitter

Practical

Core: 벡터 DB 및 의미 검색 (Vector Search Ops)

Why to Learn: 수조 개의 문서 정보 속에서 0.1초 만에 물리적으로 관련 있는 수치 데이터를 추출하기 위해서입니다.
What to Learn:
- Similarity Metrics (L2, Inner Product): 벡터 간의 물리적 거리를 계산하는 수리 기준
- Indexing (HNSW, IVFPQ): 수치 검색 속도를 기하급수적으로 높이는 물리적 인덱스 구조
- Hybrid Search: 수리적 의미(Dense)와 키워드 빈도(Sparse)를 물리적으로 결합하는 법
How to Learn:
- Pinecone이나 Chroma를 사용하여 만 단위의 벡터 정보를 물리 스캔하고 수리적 재현율( $Recall$ )을 측정하는 실습
- 수천 차원의 벡터 수치를 **양자화(Quantization)**하여 검색 하드웨어의 메모리 수치를 절약하는 물리 최적화
Implement: 벡터 사이의 수리적 최단 경로를 검색하는 기초 Vector_Navigator

Advanced

Core: 고급 사고 기법과 RAG 평가 (Advanced Reasoning)

Why to Learn: 복잡한 다단계 하드웨어 문제를 풀고, 생성된 지능의 수리적 결함을 물리적으로 자동 검증하기 위함입니다.
What to Learn:
- Chain-of-Thought (CoT): 모델이 중간 수리 과정을 물리적으로 기술하게 하여 논리 완성
- ReAct: 모델이 외부 도구나 검색 수치를 스스로 물리 사용하여 문제를 푸는 역학
- RAG Evaluation (RAGAS): 검색 수치의 물리적 적합성과 생성의 수리적 충실도를 수치 정량화
How to Learn:
- 여러 하드웨어 가이드를 종합해야 풀 수 있는 복잡한 시나리오에서 모델의 사고 사슬 수치 오류 분석 실습
- 모델의 답변이 원문 수치 데이터에서 '탈선'했는지 자동 검사하는 물리적 '정답기( $Judge$ )' 시스템 구축
Implement: 사고 과정을 기록하고 최종 수리 해를 도출하는 Reasoning_Engine

7. Terminology

Term (EN / ko, abbr)	1문장 정의	단계(기본/권장/실무/심화)	역할/맥락	관련 개념	유사/대비/함께 사용	오해 포인트	Evidence(Primary/Secondary/Industry)	Flags(core)
RAG	언어 모델의 지능에 외부 데이터의 수치적 검색 결과를 물리적으로 결합하여 최신 정보를 제공하는 기법입니다.	기본	외부 지식	Retrieval / Vector	Fine-tuning	학습이 아닌 검색 기반임	Industry	core
Vector DB	텍스트의 수리적 의미(Embedding)를 물리적 위치 값으로 저장하고 검색하는 특수 하드웨어 저장소입니다.	추천	저장소	Latent / Index	SQL DB	의미의 거리를 계산함	Industry	core
CoT	복잡한 수리/물리 문제를 해결하기 위해 모델이 중간 사고 단계를 논리적으로 기술하게 유도하는 기법입니다.	실무	추론 가이드	Logic / Steps	Few-shot	단순 명령어 이상의 논리임	P1:CS2023	core
Hallucination	모델이 수리적으로는 개연성 있으나 실제 물리적 사실과는 다른 거짓 정보를 생성해 내는 현상입니다.	추천	위험 관리	Grounding / Fact	Noise	의도한 거짓말이 아님	Industry	core

8. References

Primary

[P1] CS2023 - Artificial Intelligence (AI) - Knowledge Retrieval & Interaction — Academic curricula.
[P4] DS-BoK (EDSF) - Data Analytics / Contextual Interaction — Definition of interaction skills.

Secondary

[Building LLM Applications] Various - Design patterns for RAG and Prompting.
[DeepLearning.AI: Prompt Engineering for Developers] — Practical course on interaction physics.

Industry

[LangChain Documentation: RAG and Concepts] — The standard implementation framework.
[LlamaIndex Documentation: Data Connectors] — Advanced retrieval strategies.

9. Final Checklist

Primary

'컨텍스트 윈도우'의 물리적 한계 수치가 모델의 '기억 누락' 현상에 미치는 수리적 영향을 설명 가능한가? (P4)
'의미 검색' 시 도출된 '유사도 점수' 수치가 생성물에 대한 모델의 물리적 확신도와 어떤 상관관계를 갖는지 기술할 수 있는 가? (P1)

Secondary

'파인튜닝' 대비 'RAG'가 실시간 하드웨어 지식 업데이트 비용 수치를 물리적으로 얼마나 절감하는지 소통 가능한가?
Chain-of-Thought 적용 시 모델의 수리적 '중간 연산 토큰' 비용이 물리적 정확도 대비 효율적인지 논증할 수 있는 가?

Industry

실무 서비스에서 재발하는 '환각' 수치를 줄이기 위해 어떤 RAG 파이프라인의 물리 수치를 보정할지 제안할 수 있는 가? (SFIA)
여러 벡터 데이터베이스 하드웨어의 인덱싱(Indexing) 속도와 수리 정합성(Precision) 수치를 대조 분석할 수 있는 가?

Prompt Engineering & RAG Mechanics

1. Overview

2. Scope & Boundaries

In-Scope

Out-of-Scope

Boundaries

3. Counterexample

4. Prerequisites

5. Learning Map

6. Learning Topics

Basic

Core: 프롬프트 패턴과 소수샷 학습 (Prompt Physics)

Recommended

Core: RAG의 수리적 시퀀스와 텍스트 분할 (Retrieval Dynamics)

Practical

Core: 벡터 DB 및 의미 검색 (Vector Search Ops)

Advanced

Core: 고급 사고 기법과 RAG 평가 (Advanced Reasoning)

7. Terminology

8. References

Primary

Secondary

Industry

9. Final Checklist

Primary

Secondary

Industry

Concepts & Tags