Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

本篇是《Diffusion Model (扩散生成模型)的基本原理详解(一)Denoising Diffusion Probabilistic Models(DDPM)》的续写,继续介绍有关diffusion的另一个相关模型,同理,参考文献和详细内容与上一篇相同,读者可自行查阅,本篇着重介绍Score-Based Generative Modeling(SGM)的部分,本篇的理论部分参考与上一节相同,当然涉及了一些原文的理论部分,笔者在这里为了更能让各位读懂,略掉了原文的一些理论证明,感兴趣读者可以自行阅读Song Yang et al.SGM原文。笔者只介绍重要思想和重要理论,省略了较多细节篇幅。下一节介绍本基础系列最后一部重点:Stochastic Differential Equation(SDE)。

2、Score-Based Generative Models(SGM)

不同于DDPM,这是一个基于分数的Model,换而言之通过预测评分来获取最终的信息。在阅读本篇之前,这样我们显然会产生两个问题:
一、Network应该以什么为基准的评分?
二、DDPM网络是一个可以直接给出的后验分布(去噪链),那么如果我得到了一个基于评分的网络,如何进行所谓的“采样”,这里没有直接对分布进行所谓的预测。
下面开始进入正题介绍,先从评分函数讲起。

2.1、Score-Function(评分函数)

SGMS的核心思想在于评分函数的定义,让我们来一起看一下它的Score-Function的定义是怎么样定义的,以下是它的定义:

假若有一个概率密度函数Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),定义“Stein-ScoreFunction”如下:
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)显然的,该score表示了概率密度函数增长的快慢程度。

2.2、SGM forward Markov Chain(加噪链)——Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

我们仍旧假设原始数据Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)是从某一分布Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)中采样得到。不同于之前DDPM,SGM使用另外一种更直接化的分布来进行采样,具体操作如下:假设生成噪声步长为Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),给予一组逐步弱化的噪声:Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),则会有如下结论:
在第Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)步噪声数据Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)满足从如下分布中进行采样:
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

2.3、Score-Network——Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

2.3.1、SGM与DDPM的一致性&Loss-Function

不同于DDPM,这里并不是直接训练出一个去噪链直接解决问题并生成数据,我们的目的是想训练出一个可以模拟Score-Function的良好网络,再基于该Score-Function进行反向的采样,即想要设计一个Network :Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)用来模拟当前的Score-Function:Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)。那么显然地,目标函数变为:
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
而我们已经知道了Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
那么显然地,我们会有Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
则会有当前优化目标可以视为如下的函数
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
注意到第一项,这可视为从正态分布进行的采样,差了一个非网络参数Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)即:
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
如果读者已经度过了笔者写过的(一)DDPM部分,读者会惊奇的发现,这与DDPM的优化目标是一致的,从原理上,它们的目的是相同的。

2.3.2、SGM-Sampling(Langevin Monte Carlo)

SGM的采样办法有很多种,不同于DDPM的那种“一步一步”反向估计后验估计的办法,这里首先介绍使用Langevin Monte Carlo(基于Langevin Dynamics的一种办法)进行采样,这里介绍算法过程,有关Langevin Monte Carlo理论部分的介绍可见随机过程中的Important-Sampling等会有一些介绍,笔者之后会给予一些简单的补充资料来对Langevin Monte Carlo理论进行说明,这里读者可以认为它的目的是去模拟原始分布Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),然后直接用该分布采样生成数据。
先来介绍Langevin Monte Carlo采样算法的过程:
假设我们已经训练好了一个网络Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),它可以作为Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)的近似,我们下面要利用该网络进行分布预估:给定比步长(固定)为Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)足够小Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),迭代次数为Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)。下面进行反向生成过程,笔者将其总结为SGM算法:

SGM算法(Langevin Monte Carlo法)
①、随机采样一个样本Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)足够大Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM),记录当前时间Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
②、迭代Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM) 直到Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
③、Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)
④、重复②~③直到Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2023年12月23日
下一篇 2023年12月23日

相关推荐