생성 모델2021

디퓨전 모델 (Diffusion Models)

노이즈 제거 과정으로 고품질 이미지를 생성

디퓨전 모델: 전방 과정(노이즈 추가) → 역방향 과정(노이즈 제거)으로 이미지 생성 (Wikimedia Commons)

디퓨전 모델: 전방 과정(노이즈 추가) → 역방향 과정(노이즈 제거)으로 이미지 생성 (Wikimedia Commons)

디퓨전 모델은 데이터에 점진적으로 노이즈를 추가한 뒤, 그 역과정을 학습합니다. DALL-E 2, Stable Diffusion 등의 기반 기술입니다.

핵심 수식

전방 과정
q(xtxt1)=N(xt;1βtxt1,  βtI)q(x_t | x_{t-1}) = \mathcal{N}(x_t; \sqrt{1-\beta_t}\, x_{t-1},\; \beta_t I)
역방향 과정
pθ(xt1xt)=N(xt1;μθ(xt,t),  σt2I)p_\theta(x_{t-1} | x_t) = \mathcal{N}(x_{t-1}; \mu_\theta(x_t, t),\; \sigma_t^2 I)

핵심 개념

전방 과정(Forward)

데이터에 가우시안 노이즈를 점진적으로 추가하는 과정

역방향 과정(Reverse)

노이즈를 단계적으로 제거하며 데이터를 복원하는 학습 과정

잠재 공간 디퓨전(LDM)

픽셀 대신 압축된 잠재 공간에서 디퓨전을 수행 → Stable Diffusion의 핵심

주요 인물

로빈 롬바흐
Stable Diffusion / Latent Diffusion 논문 1저자
조나단 호
DDPM 논문 저자, 디퓨전 모델 부흥의 시작

영향 & 의의

GAN을 대체하는 이미지 생성의 새 표준. Stable Diffusion, DALL-E, Midjourney 등 생성형 AI 열풍의 기반 기술이 되었습니다.

관련 항목