Diffusion 学习路径指南!
目录
Diffusion 学习路径梳理
本博客旨在系统梳理 Diffusion 模型的学习路径,构建清晰的学习框架,便于本科生和研究生初学者快速入门并逐步进阶。
1. Diffusion Models 入门教程推荐
适合初学者阅读,内容通俗易懂、涵盖基础与前沿:
🧑🏫 基础入门教程
Tutorial on Diffusion Models for Imaging and Vision
对 Diffusion 各类公式进行了系统汇总,并分析了与 VAE 等其他生成模型的联系。Understanding Diffusion Models: A Unified Perspective
从 deterministic sampler 角度出发,进一步引入 flow matching,兼具基础与前沿性。Step-by-Step Diffusion: An Elementary Tutorial
逐步拆解 diffusion 原理,深入浅出,适合快速构建基本认知。
📚 应用与综述
- Diffusion Models: A Comprehensive Survey of Methods and Applications
对 Diffusion 各种应用方向进行了全面总结,适合查阅使用场景。
2. Diffusion Models 基础入门必读
📌 核心论文
DDPM: Denoising Diffusion Probabilistic Models
虽非最早提出 Diffusion 思路,但首次实现并获得成功,意义重大。NCSN: Generative Modeling by Estimating Gradients of the Data Distribution
使用 score matching 来估计数据分布梯度,开启了 score-based 模型的路径。Score-SDE: Score-Based Generative Modeling through Stochastic Differential Equations
用 SDE 统一前两类方法,为 diffusion 提供了坚实理论基础。EDM: Energy-Based Generative Modeling with Diffusion Processes
从 noise schedule 入手,统一现有 Diffusion 模型框架。
⚙️ 采样与加速
DDIM: Denoising Diffusion Implicit Models
跳步采样技术,摆脱马尔科夫链,显著提升采样速度。DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Models
另一种采样加速方式,基于 ODE 视角。
🧠 潜空间建模
- Latent Diffusion(LDM):
- Score-based Generative Modeling in Latent Space
引入 encoder-decoder,将 Diffusion 模型迁移至 latent space。 - High-Resolution Image Synthesis with Latent Diffusion Models
即 Stable Diffusion 原始论文,进一步优化模块训练流程,提高图像质量。
- Score-based Generative Modeling in Latent Space
3. Diffusion Models 进阶阅读
🔍 Guidance(引导机制)
🔁 Flow Matching 方法
🚀 Rectified Flow 及改进
- Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow
- Improving the Training of Rectified Flows
🔗 Schrödinger Bridge 方法
🔄 Consistency 模型
如有补充推荐或建议,欢迎交流!🌱