文生图模型之Stable Diffusion

青葱年少 • 2024年1月16日下午11:43 • IT • 阅读 65

原始文章地址

Table of Contents

SD

autoencoder

CLIP text encoder

tokenizer最大长度为77（CLIP训练时所采用的设置），当输入text的tokens数量超过77后，将进行截断，如果不足则进行paddings，这样将保证无论输入任何长度的文本（甚至是空文本）都得到77×768大小的特征

问题：当输出超长prompt会分段处理？每段的权重如何处理？

UNet

text condition将通过CrossAttention模块嵌入进来，此时Attention的query是UNet的中间特征，而key和value则是text embeddings。

SD图生图

SD Inpainting

第一种形式：

第二种形式：

SD loss函数

SDXL

论文解析地址

版权声明：本文为博主作者：Kuekua-seu原创文章，版权归属原作者，如果侵权，请联系我们删除！

原文链接：https://blog.csdn.net/u012554092/article/details/132490616

stable diffusion

赞 (0)

青葱年少普通用户

0

最新2022 GUCCI AI面试真题题库

上一篇 2024年1月16日

如何打造良好的技术团队分享氛围

下一篇 2024年1月16日

Stable Diffusion WebUI 生成参数：脚本（Script）——提示词矩阵、从文本框或文件载入提示词、X/Y/Z图表 2024年4月1日
Stable Diffusion：使用Lora用二十张图片训了一个简易版薇尔莉特头像生成器（不作商用，纯纯个人兴趣，狗头保命） 2023年12月11日
AIGC专栏3——Stable Diffusion结构解析-以图像生成图像（图生图，img2img）为例 2023年12月7日
从0到1，入门到进阶玩转AI——Stable Diffusion超详细教程（一） 2023年12月13日
吴恩达AIGC《How Diffusion Models Work》笔记 2023年12月13日
AI 绘画咒语入门 – Stable Diffusion Prompt 语法指南【成为初级魔导士吧！】 2023年6月20日
stable diffusion实践操作-随机种子seed 2023年12月20日
AI 在编程、写作、绘画领域的占卜：从 GitHub Copilot 到 ChatGPT，再到 Stable Diffusion… 2023年12月19日
【AI绘图丨 Stable_diffusion 系列教程三】— 无需配置环境 | Colab直接运行Stable Diffusion web UI并从civitai中导入lora模型 2023年8月16日
【AIGC核心技术剖析】Hotshot-XL 一种 AI 文本转 GIF 模型（论文 + 代码：经过训练可与Stable Diffusion XL一起使用） 2023年12月11日
创意无限！AI绘画、ChatGPT、AIGC工具合集，让你的创作梦想成真 2023年12月13日
【AI绘图丨 Stable_diffusion 系列教程一】— Window 环境 | Stable Diffusion入门教程及安装（上篇） 2023年12月14日
本地生成动漫风格 AI 绘画图像｜Stable Diffusion WebUI 的安装和局域网部署教程 2023年2月25日
理解DALL·E 2， Stable Diffusion和 Midjourney工作原理 2023年2月25日
Stable Diffusion最全保姆级安装教程(建议收藏) 2023年12月4日
Stable Diffusion-webUI ckpt模型、lora模型的区别和使用 2023年12月19日