콘텐츠로 바로가기

Image Processing & Computer Vision

디지털 이미지를 수리적으로 분석하여 에지(Edge)와 특징점을 추출하고, 기계가 물리적 세계의 형태와 객체를 인지하게 만드는 수치 해석 기술을 다룹니다.

sys.entry
M

Me

hyunyoun's Blog

posts6 min read

1. Overview

이미지 처리 및 컴퓨터 비전(Image Processing & Computer Vision, ICV)은 픽셀의 집합체인 디지털 영상을 수리적으로 해석하여 유의미한 물리적 정보를 도출하고, 인간의 시각 인지 능력을 기계적으로 재현하는 '시각 데이터 지능화' 기술입니다.

학습자는 픽셀 주변부 수치들을 가중 평균하여 노이즈를 제거하거나 선명도를 높이는 컨벌루션 커널(Convolution Kernel) 연산과, 명암의 수리적 급변점을 찾는 **에지 검출(Edge Detection)**을 배웁니다. 특히, 이미지 내에서 변하지 않는 물리적 표지인 특징점 추출과 딥러닝 기반의 객체 분류 및 인식 수순을 익힙니다. 이를 통해 단순히 사진을 보여주는 것을 넘어 영상 속의 물리적 맥락을 수치적으로 읽어내는 하이엔드 기계 시각 거버넌스 역량을 확보합니다.

2. Scope & Boundaries

In-Scope

  • Spatial Domain Filtering: 픽셀 좌표계에서의 수리적 필터링(Blur, Sharpen 등)
  • Feature Detection Dynamics: Sobel, Canny 등 수학적 미분을 이용한 물리적 경계선 색출
  • Image Transformation Math: 기하학적 수치 변이(Rotation, Scaling, Warp) 및 투영 교정
  • Object Recognition Calculus: HOG, Haar Cascades 및 CNN 기반의 수리적 패턴 매칭
  • Stereo Vision Physics: 두 대의 카메라 수치로부터 물리적 깊이(DepthDepth) 정보를 복원하는 법

Out-of-Scope

  • 그래픽 디자인을 위한 리터칭 수법이나 구도 연출 (예술 영역)
  • 카메라 렌즈의 코팅 방식 및 물리적 하우징 제조 (광학 기기 영역)

Boundaries

  • ICV vs. Computer Graphics: 그래픽스(12-05-XX)가 '수리 데이터를 물리 이미지로 출력'하는 가상화에 집중한다면, ICV는 '물리 이미지를 수리 데이터로 역추적'하는 실체화에 집중하여 구분합니다.

3. Counterexample

  • 단순히 "포토샵 필터 씌우기"라 설명하는 것은 ICV 학습이 아닙니다. 왜 이미지의 히스토그램 평탄화 수순이 물리적 밝기 대비를 수리적으로 개선시키는지 증명할 수 있어야 하며, 컨벌루션 연산 시 하드웨어의 물리적 '제로 패딩(ZeroZero-paddingpadding)' 수치 오차가 외곽선 데이터 인식에 주는 영향을 논증하지 못한다면 비전 공학의 본질을 이해하지 못한 것입니다.

4. Prerequisites

  • Linear Algebra (Basic): 04-XX-XX의 행렬 곱셈 및 커널(Kernel) 연산 물리 이해가 필수입니다.
  • Calculus (Recommended): 04-XX-XX의 편미분 및 그라디언트(GradientGradient) 수리 물리 이해가 권합됩니다.

5. Learning Map

  1. Pixel Arithmetic: 픽셀 수치들을 더하고 곱하여 이미지의 물리적 품질을 수리적으로 개선합니다.
  2. Edge & Shape: 픽셀값의 물리적 도약 지점을 수치 미분하여 사물의 윤곽선을 추출합니다.
  3. Keypoint Atlas: 이미지의 회전이나 크기 변화 수치에도 견고하게 유지되는 특징 물리량을 색인합니다.
  4. Semantic Perception: 수치 덩어리로부터 '자동차'나 '사람'이라는 물리적 객체를 판별하는 하이엔드 인지 시스템을 완성합니다.

6. Learning Topics

Basic (기초)

Core: 디지털 이미지와 필터링의 물리 (Filtering Fundamentals)

  • Why to Learn: 이미지를 기계가 읽기 좋은 수리적 상태로 정제하고 노이즈를 물리적으로 제거하기 위해서입니다.
  • What to Learn:
    • Image Representation: 픽셀 수치와 비트맵(Bitmap) 물리 저장 방식
    • Convolution Engine: n x n 수리 커널을 이미지 전체에 물리 슬라이딩하는 수순
    • Blur & Sharpen Math: 주변 픽셀과의 수리적 가중치 조절을 통한 선명도 물리 제어
  • How to Learn:
    • Mean/Gaussian Filter 수치를 조절하며, 이미지의 물리적 자글거림(NoiseNoise)이 수리적으로 매끈하게 변하는 실습
    • Identity Kernel 수치에서 필터 값을 인위적으로 뒤틀며 물리적인 상 왜곡 현상 분석
  • Implement: 3x3 커널을 입력 이미지 수치 행렬에 적용하여 결과 픽셀을 도출하는 기초 Pixel_Convolution_Agent

Core: 특징 추출과 에지 검출 (Feature Dynamics)

  • Why to Learn: 영상 데이터에서 사물의 물리적 크기와 형태를 정의하는 결정적 수치 정보를 얻기 위함입니다.
  • What to Learn:
    • Image Gradients: 픽셀 수치의 변화량(미분 수치)을 이용한 경계 추적
    • Canny Edge Algorithm: 노이즈 수리 억제 후 물리적 윤곽선을 확정하는 수순
    • Corner Detection: 이미지의 물리적 꺾임 지점을 수리적으로 색출(Harris 등)
  • How to Learn:
    • Sobel Filter를 X/Y축으로 가동하며, 물리적 수직/수평선의 수리적 세기를 대조하는 실습
    • 특징점 추출 시 Non-maximum Suppression 수순을 거쳐 가장 첨예한 물리 경계만을 남기는 훈련
  • Implement: 이미지 픽셀의 수리적 변화율을 계산하여 외곽선 수치를 반환하는 Boundary_Line_Detector

Practical (실무)

Core: 기하학적 변환과 특징 매칭 (Geometric Matching)

  • Why to Learn: 카메라의 위치가 물리적으로 변해도 동일한 사물을 수리적으로 동일하다고 인지하기 위해서입니다.
  • What to Learn:
    • Affine & Perspective Transform: 좌표를 물리적으로 밀거나 비틀어 시각적 수치 보정
    • Scale-Invariant Feature Transform (SIFT): 물리 크기 수치에 무관한 하이엔드 특징 기술
    • RANSAC Algorithm: 오염된 수치 데이터 속에서 올바른 물리 매칭 수순을 색출
  • How to Learn:
    • 찢어진 사진 조각의 수리적 특징점을 대조하여 하나의 물리 이미지로 파노라마 스티칭하는 실습
    • Homography Matrix 수치를 산출하여, 기울어진 수리적 평면을 물리적인 정면 샷으로 복원하는 훈련
  • Implement: 두 이미지에서 추출된 수치 벡터들 사이의 물리 거리를 계산하여 동일 지점을 찾는 Feature_Match_Governor

Advanced (심화)

Core: 객체 검출과 딥러닝 비전 (Advanced Perception)

  • Why to Learn: 복잡한 물리 배경 속에서 특정 대상을 하이엔드 정확도로 자동 분류하고 추적하기 위함입니다.
  • What to Learn:
    • Sliding Window vs Region Proposal: 객체 물리 위치를 수리적으로 훑는 다양한 기법
    • Object Classification Logic: 추출된 특징 물리량을 바탕으로 수리적 라벨(LabelLabel) 부여
    • Optical Flow Dynamics: 연속된 영상 프레임 속에서 물리 개체의 수리적 이동 벡터 추적
  • How to Learn:
    • YOLO (You Only Look Once) 모델의 수리적 격자 분석 수순을 이해하고 실시간 물리 객체 검출 실습
    • Mean-shift Tracking 수치를 활용하여, 빠르게 가속하는 물리 객체를 수리적으로 놓치지 않는 프로젝트
  • Implement: 사물 영역의 물리적 바운딩 박스(BBoxBBox) 수치를 수리 산출하는 하이엔드 Object_Recognition_Engine

7. Terminology

Term (EN / ko, abbr) 1문장 정의 단계(기본/권장/실무/심화) 역할/맥락 관련 개념 유사/대비/함께 사용 오해 포인트 Evidence(Primary/Secondary/Industry) Flags(core)
Convolution 입력 이미지에 수리적 커널을 겹쳐 요소별 물리적 곱셈과 합산을 수행하는 핵심 연산입니다. 기본 연산 원형 Filter / Kernel Pooling 인공신경망 아님 P1:CS2023 core
Edge Detection 픽셀값의 물리적 변화율이 급격한 지점을 찾아 사물의 윤곽을 수리적으로 추출하는 기술입니다. 추천 형태 분석 Gradient / Sobel Canny 선 긋기 아님 P1:CS2023 core
Feature Point 이미지의 회전이나 크기 물리 수치 변화에도 변하지 않는 고유한 수리적 식별 지점입니다. 추천 매칭 지표 Keypoint / SIFT SURF 점 하나가 아님 Industry core
Object Detection 이미지 속에서 특정 물리 객체의 존재 수치를 확인하고 위치 좌표를 수리적으로 특정하는 작업입니다. 실무 인지 작업 Classification / BBox Segment 분류와는 다름 Industry core

8. References

Primary References

Secondary References

  • [Computer Vision: Algorithms and Applications] Richard Szeliski — Comprehensive system guide.
  • [Learning OpenCV 4] Adrian Kaehler — Practical implementation standards.

Industry References

  • [OpenCV: Official Documentation & Tutorials] — World standard for image governance.
  • [MediaPipe: Building Multi-modal Applied ML Pipelines] — High-end industrial vision.

9. Final Checklist

Primary Checklist

  • '컨벌루션' 수순이 이미지의 물리적 '노이즈'를 어떻게 수리적으로 '억제'하거나 '추출'하는지 설명 가능한가? (P1)
  • '에지 검출' 알고리즘이 이미지의 물리적 '미분 수치'를 어떻게 수리적으로 해석하는지 논증할 수 있는 가? (P1)

Secondary Checklist

  • '특징점 매칭' 수순에서 Inlier 수치를 확보하기 위한 수리적 '필터링' 전략을 소통 가능한가?
  • Image Warping 수식에서 물리적 보간(BilinearBilinear-InterpolationInterpolation) 수치가 픽셀의 결과색에 미치는 영향을 산출할 수 있는 가?

Industry Checklist

  • 실무 비전 서비스 검수 시, 하드웨어 NPU Utilization 수치를 분석하여 초당 프레임 수리 상한을 제안할 수 있는 가? (SFIA)
  • Confusion Matrix 수치 분석을 통해, 특정 물리 환경에서의 객체 인식 수리적 오류 패인을 진단하고 가이드할 수 있는 가?