생성형 비전 중심 학습 제품

수학 감각이 약해도, 최신 비전 모델까지 따라갈 수 있게.

확률과 선형대수의 직관부터 시작해서 딥러닝, CNN, U-Net, Transformer, Diffusion, 그리고 최신 생성형 비전 모델을 읽고 개선하는 사고방식까지 연결한다.

Learning Path

기초에서 최신 생성형 비전까지 이어지는 7단계

각 단계는 무엇을 배우는지뿐 아니라, 그 개념이 실제 비전 모델을 만들고 개선할 때 왜 중요한지도 같이 설명한다.

Stage 1

Math Foundations

벡터, 행렬, 미분, 확률을 식 암기용이 아니라 모델을 이해하기 위한 언어로 다시 잡는다.

  • 벡터와 행렬
  • 미분 직관
  • 확률 기초
  • 기댓값과 분산
Stage 2

Deep Learning Foundations

신경망, loss, backprop, regularization을 “모델이 어떻게 좋아지는가” 관점에서 본다.

  • MLP 직관
  • backprop
  • loss와 metric
  • training loop
Stage 3

Image Representation & CNN Intuition

이미지가 어떻게 tensor로 표현되고 convolution이 어떤 inductive bias를 제공하는지 이해한다.

  • image tensor
  • convolution
  • receptive field
  • downsampling and upsampling
Stage 4

U-Net and Structured Generation

encoder-decoder와 skip connection이 왜 강력한지 이해하고, U-Net이 diffusion 계열 모델과 어떻게 이어지는지 배운다.

  • encoder-decoder
  • skip connection
  • segmentation intuition
  • generation bridge
Stage 5

Transformers for Vision

self-attention, cross-attention, tokenization을 통해 Transformer가 이미지를 다루는 방식을 배운다.

  • self-attention
  • cross-attention
  • vision tokens
  • conditioning
Stage 6

Diffusion and Modern Generative Models

denoising, latent diffusion, guidance를 중심으로 현대 생성형 비전의 핵심 아이디어를 이해한다.

  • diffusion basics
  • latent diffusion
  • guidance
  • text-to-image
Stage 7

Reading and Improving SOTA Models

논문을 구조적으로 읽고, ablation과 error analysis를 통해 개선 루프를 만드는 법을 배운다.

  • paper reading
  • ablation thinking
  • error analysis
  • improvement loops

Design Principles

노트 모음이 아니라 성장 경로로 만든다

직관 먼저, 수식은 그 다음

식부터 밀어붙이지 않고 왜 이 개념이 필요한지부터 이해하게 만든다.

엔지니어링 연결

모든 개념을 학습, 디버깅, 평가, 모델 개선과 연결한다.

생성형 중심 경로

U-Net, Transformer, Diffusion을 축으로 현대 비전 모델을 이해하게 만든다.

Engineer Mindset

비전 엔지니어의 개선 루프

1

실패 관찰

출력 사례와 edge case를 보고 문제가 어디서 생기는지 확인한다.

2

가설 세우기

데이터, 구조, 목적함수, 학습 설정 중 어디가 원인인지 추정한다.

3

실험 설계

중요한 변수 하나씩 바꾸며 비교 가능한 실험을 만든다.

4

반복 개선

정량 지표와 정성 검토를 함께 보고 다음 수정으로 이어간다.

Start Here

지금 바로 읽어볼 만한 추천 시작점

아직 전부 채워지지 않았으니, 지금은 수학 기초 → U-Net → Transformer 순서로 먼저 읽는 걸 추천한다.

Math Foundations

확률이 약한 사람도 따라올 수 있도록 직관 중심으로 다시 시작한다.

읽으러 가기 →

U-Net and Structured Generation

생성형 비전으로 넘어가는 첫 다리로 U-Net을 다시 이해한다.

읽으러 가기 →

Transformers for Vision

attention과 conditioning을 비전 생성 관점에서 이해한다.

읽으러 가기 →