생성 모델2021

디퓨전 모델 (Diffusion Models)

노이즈 제거 과정으로 고품질 이미지를 생성

디퓨전 모델: 전방 과정(노이즈 추가) → 역방향 과정(노이즈 제거)으로 이미지 생성 (Wikimedia Commons)

디퓨전 모델은 데이터에 점진적으로 노이즈를 추가한 뒤, 그 역과정을 학습합니다. DALL-E 2, Stable Diffusion 등의 기반 기술입니다.

전방 과정

q(x_t | x_{t-1}) = \mathcal{N}(x_t; \sqrt{1-\beta_t}\, x_{t-1},\; \beta_t I)

역방향 과정

p_\theta(x_{t-1} | x_t) = \mathcal{N}(x_{t-1}; \mu_\theta(x_t, t),\; \sigma_t^2 I)

전방 과정(Forward)

데이터에 가우시안 노이즈를 점진적으로 추가하는 과정

역방향 과정(Reverse)

노이즈를 단계적으로 제거하며 데이터를 복원하는 학습 과정

잠재 공간 디퓨전(LDM)

픽셀 대신 압축된 잠재 공간에서 디퓨전을 수행 → Stable Diffusion의 핵심

로

로빈 롬바흐

Stable Diffusion / Latent Diffusion 논문 1저자

조

조나단 호

DDPM 논문 저자, 디퓨전 모델 부흥의 시작

GAN을 대체하는 이미지 생성의 새 표준. Stable Diffusion, DALL-E, Midjourney 등 생성형 AI 열풍의 기반 기술이 되었습니다.

AI 발전사