跨域小样本—cross domain few shot—第二弹

简单来说就是在Few-shot Learning问题中加入了跨域问题,具体表现在:在一个数据集上进行Few-shot训练,完成后在另一个数据集Few-shot测试,两个数据集中没有相同的类别。

  1. 跨域小样本—cross domain few shot—第一弹

Universal Representation Learning from Multiple Domains for Few-shot Classification (ICCV2021)

问题: 现有解决方案首先会在多个数据集分别训练特征提取器,随后在测试阶段筛选或者融合来自不同提取器的特征,如下图(a)所示,但是针对小样本场景中样本少的问题导致筛选、融合过程难以实现。
创新点: 本文使用对多个特征提取器进行知识蒸馏,从而避免了测试过程中的筛选、融合步骤,下图(b)所示。

具体框架图:

  1. 第一阶段,首先在每个域训练对应的特征提取器跨域小样本---cross domain few shot---第二弹域分类器跨域小样本---cross domain few shot---第二弹
  2. 第二阶段,将所有的跨域小样本---cross domain few shot---第二弹跨域小样本---cross domain few shot---第二弹冻结,然后使用知识蒸馏来学习跨域小样本---cross domain few shot---第二弹
    2.1 特征约束: 在知识蒸馏阶段,每个域图像分别进入各自的特征提取器跨域小样本---cross domain few shot---第二弹,并进入 跨域小样本---cross domain few shot---第二弹跨域小样本---cross domain few shot---第二弹的输出特征会进入对应的域适配器跨域小样本---cross domain few shot---第二弹进行线性变换。最后使用CKA (一种骚距离度量)跨域小样本---cross domain few shot---第二弹跨域小样本---cross domain few shot---第二弹的输出进行约束。
    2.2 结果约束: 跨域小样本---cross domain few shot---第二弹的输出输入到对应的跨域小样本---cross domain few shot---第二弹中得到分类结果,跨域小样本---cross domain few shot---第二弹的输出输入到冻结的跨域小样本---cross domain few shot---第二弹得到分类结果,计算两种结果的KL损失。
  3. 两种约束能够在不同层面上帮助网络进行知识蒸馏,在测试阶段使用跨域小样本---cross domain few shot---第二弹作为特征提取器,在support-set上训练一个跨域小样本---cross domain few shot---第二弹,最后参考Few-shot分类范式,使用跨域小样本---cross domain few shot---第二弹跨域小样本---cross domain few shot---第二弹完成query-set的分类。

Cross-domain Few-shot Learning with Task-specific Adapters (CVPR2022)

跟上一篇出自同一个团队 (很专注)
创新点: 去除了迁移过程中繁琐的adapter步骤,将task adaptation依附在训练过程中,在训练过程中完成适配。

具体框架:

  1. 在ImageNet上训练得到特征提取器跨域小样本---cross domain few shot---第二弹

  2. support-set中,在冻结的跨域小样本---cross domain few shot---第二弹的各个层间加入 task-specific weights:跨域小样本---cross domain few shot---第二弹,具体是加入各种变换。将经过这些变换后得到的特征输入到分类器跨域小样本---cross domain few shot---第二弹中进行分类。

  3. 超级总结: 在冻结的特征提取器跨域小样本---cross domain few shot---第二弹的层之间加入跨域小样本---cross domain few shot---第二弹卷积,并最后一层再加入线性变换器跨域小样本---cross domain few shot---第二弹。这些简单的操作,再Few-shot setting下就有了神奇的魔力。因为Few-shot是基于episodes训练的,所以训练过程中这些跨域小样本---cross domain few shot---第二弹卷积层与最后的变换器拟合了大量的task,具备了元迁移的能力(非常玄乎),为什么有效呢?我认为这种设定,在单domain训练中能够起到增强特征的作用,类似增加一些扰动进去,会增强特征的泛化性;在多domain训练中,由于episodes训练的原因,网络能够收集不同域的经验,起到文中提到的适配的作用,最终适配不同域的数据。

跨域数据集

多源域自适应矩阵匹配:Moment Matching for Multi-Source Domain Adaptation,ICCV2019

收集并注释了迄今为止最大的UDA数据集DomainNet,存在显著的领域差距和大量的类别,它包含6个域和分布在345个类别中的约60万幅图像。

Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples(ICLR )

相较于上一篇,数据集是按领域来划分,即数据集间没有类别交叉

MSeg: A Composite Dataset for Multi-domain Semantic Segmentation

综合好几个分割数据集(多数为街景)为一个大的数据集,将类别进行了更加精细的处理。

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(1)
青葱年少的头像青葱年少普通用户
上一篇 2022年5月21日
下一篇 2022年5月21日

相关推荐