Stable Diffusion的数学原理

心中带点小风骚 • 2023年12月21日下午7:43 • IT • 阅读 35

Stable Diffusion是一种深度学习模型，用于生成和操作图像。它主要基于变分自编码器（Variational Autoencoders, VAEs）和扩散模型（Diffusion Models）的结合。下面是这些关键概念的详细解释：

变分自编码器是一种生成模型，用于学习输入数据的潜在表示。VAE包括两部分：编码器和解码器。

编码器（Encoder）：将输入数据映射到一个潜在空间（latent space）。映射过程可以表示为：

其中，是输入数据，是潜在表示，是编码器的参数。
解码器（Decoder）：将潜在空间的表示映射回数据空间，尝试重构输入。公式如下：

其中，是解码器的参数。

VAE的目标是最大化输入数据的对数似然的下界（ELBO, Evidence Lower BOund）：

Stable Diffusion的数学原理

这里， Stable Diffusion的数学原理是KL散度，一种衡量两个概率分布差异的方法。

扩散模型是一种逐步将数据从其原始状态转化为无序状态，然后再逆转这个过程以生成数据的模型。其基本步骤如下：

模型的训练目标是最小化原始数据和重构数据之间的差异。

文章出处登录后可见！

已经登录？立即刷新