wFlow(CVPR2022)-虚拟试衣论文解读

文章目录


论文: 《Dressing in the Wild by Watching Dance Videos》
github:暂未开源

解决问题

问题:
虚拟试衣已经取得较大进步,但是现有方法忽略了自然场景,在自然场景表现出衣服人体未对齐,精细纹理细节退化;
解决方法:
wFlow关注自然场景,并且在真实性及自然性上改进明显,尤其对于宽松衣服:skirt和dress,有挑战性pose:胳膊交叉、腿弯曲,凌乱背景;
2D pixel flow适用于紧身或宽松衣服,然而对于pose变化比较大时失效;3D vertex flow虽然在各种姿势上表现较好,但是牺牲变形自由度,对于宽松衣服表现不好;wFlow将两者结合,作者基于Dance50k视频数据(利用跨帧一致性自监督训练)进行虚拟试衣,不需要成对图像训练,降低工作量;
本文贡献如下:
1、第一次探究自然场景下衣服迁移问题。
2、可将任意服装迁移至任何自然场景下复杂姿势,wFlow结合2D与3D信息;
3、构建大规模视频数据集,Dance50k,包括50k个跳舞视频序列;

算法

如图1,常规训练需要成对数据,wFlow(CVPR2022)-虚拟试衣论文解读,给出wFlow(CVPR2022)-虚拟试衣论文解读,生成wFlow(CVPR2022)-虚拟试衣论文解读,然而wFlow(CVPR2022)-虚拟试衣论文解读难以获得,本文使用wFlow(CVPR2022)-虚拟试衣论文解读进行训练,其中wFlow(CVPR2022)-虚拟试衣论文解读wFlow(CVPR2022)-虚拟试衣论文解读为同一人不同姿势,可通过视频不同帧获取。

图2为wFlow整体流程,包括以下三个阶段:
有条件人体分割:生成人体layout wFlow(CVPR2022)-虚拟试衣论文解读
像素流估计:利用预测wFlow(CVPR2022)-虚拟试衣论文解读预测pixel flowwFlow(CVPR2022)-虚拟试衣论文解读
wFlow引导衣服迁移

stage1: 有条件人体分割

直接使用姿态迁移进行衣服迁移,容易出现过拟合,因为训练过程使用同一人不同姿态,但在测试时为不同人体。
因此有条件分割网络(Conditional Person Segmentation, CSN)用于预测人体分割,其既能保证目标形状,又能保留源图衣服信息,如图2a所示,
CSN包括两个编码器,首先提取来自两个图像集合特征:
(1)20通道的人体分割wFlow(CVPR2022)-虚拟试衣论文解读及人体特征wFlow(CVPR2022)-虚拟试衣论文解读(包括3通道RGB图、1通道人体mask(由wFlow(CVPR2022)-虚拟试衣论文解读二值化获得)、3通道denseposewFlow(CVPR2022)-虚拟试衣论文解读(SMPL映射到UV空间)、18通道人体关键点wFlow(CVPR2022)-虚拟试衣论文解读
(2)目标图densepose wFlow(CVPR2022)-虚拟试衣论文解读及人体关键点wFlow(CVPR2022)-虚拟试衣论文解读。使用wFlow(CVPR2022)-虚拟试衣论文解读可用于补充学习wFlow(CVPR2022)-虚拟试衣论文解读可能难以感知粗糙目标形状。
将上述两者提取到特征,送入残差网络,输出目标人体mask及分割wFlow(CVPR2022)-虚拟试衣论文解读,如式1,对于wFlow(CVPR2022)-虚拟试衣论文解读使用L1损失,wFlow(CVPR2022)-虚拟试衣论文解读使用交叉熵损失;

stage2: pixel flow估计

2D pixel flow用于保留图像之间结构及纹理信息,与目标无关,这保证对任意衣服款式的泛化性;因此作者使用PFN估计pixel flow wFlow(CVPR2022)-虚拟试衣论文解读
如图2b,其输入与CSN类似,源分支与CSN输入一致目标分支增加CSN所预测wFlow(CVPR2022)-虚拟试衣论文解读wFlow(CVPR2022)-虚拟试衣论文解读
真实场景下源图与目标图难免发生较大变形,此时仅使用PFN容易产生伪影,对此引入特征关联层提高网络泛化性
此外,编码器与解码器同层特征进行级联,加速学习进程
解码器输入为两个同级别编码器特征及其相关性向量;由于源图与目标图为同一人不同姿势,因此可通过自监督训练pixel flow估计,通过依据pixel flow映射到目标帧的纹理与真值纹理差异性进行监督
该过程如式2所示,wFlow(CVPR2022)-虚拟试衣论文解读可以映射源图到目标图纹理特征;
本文PFN与ClothFlow区别为以下三点:
1、使用densepose wFlow(CVPR2022)-虚拟试衣论文解读作为输入;
2、使用相关层提供明确特征匹配引导;
3、ClothFlow利用估计的光流扭曲每个编码特征解决特征不对齐问题,而本文没有这样做,因为如果预测光流不准确将产生累计误差;

stage3: 使用wFlow进行衣服迁移

wFlow

使用阶段2产生的2D pixel flow及3D SMPL vertex flow,提升模型容纳能力,使得当面对自然场景时,模型拥有更大姿态迁移潜力;具体来说:
1、生成拟合wFlow(CVPR2022)-虚拟试衣论文解读的SMPL body mesh,将其映射为二维UV空间的densepose表征wFlow(CVPR2022)-虚拟试衣论文解读
2、因为SMPL拓扑结构固定,因此可进行计算wFlow(CVPR2022)-虚拟试衣论文解读wFlow(CVPR2022)-虚拟试衣论文解读之间二维vertex flow wFlow(CVPR2022)-虚拟试衣论文解读
3、根据式3获取wFlow wFlow(CVPR2022)-虚拟试衣论文解读

GTN

如图2c,GTN有三个UNet生成器wFlow(CVPR2022)-虚拟试衣论文解读
wFlow(CVPR2022)-虚拟试衣论文解读修复原图与目标图背景,输入源图及目标图背景wFlow(CVPR2022)-虚拟试衣论文解读,输出修复后的背景wFlow(CVPR2022)-虚拟试衣论文解读
wFlow(CVPR2022)-虚拟试衣论文解读重构原图,wFlow(CVPR2022)-虚拟试衣论文解读联合densepose masked源RGB图wFlow(CVPR2022)-虚拟试衣论文解读及源mask wFlow(CVPR2022)-虚拟试衣论文解读,通过wFlow(CVPR2022)-虚拟试衣论文解读重构wFlow(CVPR2022)-虚拟试衣论文解读,尽量与wFlow(CVPR2022)-虚拟试衣论文解读一致;
由于wFlow(CVPR2022)-虚拟试衣论文解读来自SMPL mesh,因此,wFlow(CVPR2022)-虚拟试衣论文解读中宽松衣服的一些区域会被mask,这需要wFlow(CVPR2022)-虚拟试衣论文解读学习补充wFlow(CVPR2022)-虚拟试衣论文解读以外区域,wFlow(CVPR2022)-虚拟试衣论文解读生成过程如式4;

损失函数

GTN训练损失函数针对三部分进行:融合mask wFlow(CVPR2022)-虚拟试衣论文解读、重构wFlow(CVPR2022)-虚拟试衣论文解读、重构wFlow(CVPR2022)-虚拟试衣论文解读
使用BCE损失监督wFlow(CVPR2022)-虚拟试衣论文解读wFlow(CVPR2022)-虚拟试衣论文解读,如下式,

在线循环优化

实验

数据集

Dance50k数据集包含5W个单人跳舞序列(15s左右),其不仅可用于虚拟试衣,还可用于以人为中心的图像、视频方向;

评估方案

作者从两个角度进行评估:姿态迁移结果准确性及生成衣服迁移结果真实性;
使用SSIM评估姿态迁移;使用FID、LPIPS评估衣服迁移;使用IoU评估衣服形状,仅限于宽松衣服,由于紧身衣服通过SMPL建模IoU指标较高; 除此之外还有人工评测;

定性比较

如图4,作者在Dance5k及DeepFashion数据集,与ADGAN、DiOR、LWG进行比较;
ADGAN不能融合背景,且不能恰当的保留衣服特性;
DiOR在自然场景表现不佳,纹理失真;
LWG当面对复杂姿态时,生成模糊边缘,不能建模宽松衣服;

定量比较

消融实验

如表2为消融实验结果,

结论

本文提出wFlow结合2D与3D身体信息映射衣服纹理,同事引入循环优化适用于非常规衣服,取得不错效果,同时提出Dance50k数据集;

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2023年4月5日
下一篇 2023年4月5日

相关推荐