迁移学习领域适应性——李宏毅笔记

1.导语

在真实的机器学习项目中,我们的训练数据集和测试数据集之间存在一定的数据分布差异。这时候模型往往是过拟合的,模型在测试集上的效果不是很理想。

那怎么样在不改变数据集的情况下,提升测试集准确率呢。这个时候就有了迁移学习的一种代表方法,域自适应(Domain adaptation)。

另外在迁移学习中又分样本迁移、特征迁移和模型迁移,其中模型迁移学习与fine-tune(微调)有一些不同的地方:

虽然两者都使用经过训练的模型来解决问题,但实际上存在一些差异:

  • fine-tune(微调):是对已经训练好的模型,把整个这个模型放到另一个数据集上继续进行训练(其中参数继续发生变化)
  • 迁移学习:提取模型中一些需要的层,冻结这些层(固定层的参数),在冻结层之后增加一个新的训练层,最终完成训练。

fine-tune是继续更新模型的参数,迁移学习是固定一部分参数,训练更新一部分参数。

2.Domain adaptation

域自适应方法,通常表示具有不同域但任务相同的方法,其中域表示数据集的集合。

什么样的领域(数据集)适合领域适配?
通常我们的源域(不同于测试样本的数据集,也可以说是训练集)有标签,目标域数据(测试集)没有标签或者很少有数据有标签

2.1 Domain adaptation思路

定义源域(训练集):source
定义目标域(测试集):target

主要的思路就是将source训练好的模型能够用在target上,域适配问题最主要的就是如何减少source和target不同分布之间的差异。域适配包括无监督域适配和半监督域适配,前者的target是完全没有label的,后者的target有部分的label,但是数量非常的少

通过在不同阶段进行域适应,研究人员提出了三种不同的域适应方法:

  1. 样本适应
    :对源域样本进行加权重采样以近似目标域的分布。
  2. 特征级适配
    :将源域和目标域投影到一个共同的特征子空间中。
  3. 模型级适配
    :修改源域误差函数以考虑目标域误差。

2.2 样本自适应

样本适配也可以说是样本迁移。

基本思路:

  1. 通过对source,进行重采样,在source里找到与target相似的数据,命这些相似数据为新的source。
  2. 把source数据的数据量,量权值进行调整,使其这些数据与target数据分布基本一致,如下图所示:
    迁移学习领域适应性——李宏毅笔记
    也可以对source的数据集进行数据增强,在图像中,可以对图像进行旋转,缩放,白噪声等。

优点缺点:

  • 优点:方法简单,容易
  • 缺点:权重选择和数据相似度衡量标准难以确定

2.3 特征自适应

特征适配也可以说是特征迁移。

基本思想:
通过构建特征提取网络,训练网络模型,使模型能够提取出source与target的共同特征部分,相似的数据分布。如下图所示,我们输入source和target数据集
迁移学习领域适应性——李宏毅笔记
得到的特征数据分布是相似的。
迁移学习领域适应性——李宏毅笔记
如上图,特征提取器可以看成GAN中的generator,domain classifier就是GAN中的discriminator,我们的目的,就是找到一个特征提取器,能够使训练集与测试集的特征分布,几乎一样的,可以骗过domain classifier。

这里的提取器要做的是让生成的特征难以分辨出(也就是说让训练集和测试集的特征很相似),classifier是要努力分辨他们(我们通过classifier的反馈,进一步优化提取器),这样才能让提取器更好工作,我们最后要的是提取器。

下图为不同source和target数据集下,只有source和加入了target训练下的结果。
迁移学习领域适应性——李宏毅笔记
的优点和缺点:

  • 优点:大多数方法都有效
  • 缺点:难以解决,容易过拟合

2.4 模型自适应

模型适应是最常用的迁移学习方法,模型迁移。

基本思路:

  1. 将模型放入新的域数据集中,通过已经训练好的模型进行训练
  2. 固定部分模型层(不改变层结构和参数)
  3. 改变一些模型层,(初始化这些层的参数,也可能改变层的结构)
  4. 训练模型

如下图案例一样,模型2固定住了模型1前二层的“是否是火影”,“是否是男性”的层和参数,我们在模型2中改变了模型1后二层的层和参数,模型2就可以完成识别是不是“傻死给”的模型。
迁移学习领域适应性——李宏毅笔记

版权声明:本文为博主你家有水吗,我口渴原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/weixin_42010722/article/details/123197513

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2022年3月4日 上午10:42
下一篇 2022年3月4日 上午10:59

相关推荐