1 简单认知
作为完全的新手,推荐先去维基百度看看多示例的简介,再去CSDN等地方阅读一些多示例的综述博客,有一个总体的认知:即多示例是一种处理称之为包的学习范式,每个包由多个对象组成,一个包对应一个标签,实例通常不含标签,如下图 (b)。
Tips:我主要讲分类,因为回归的大同小艺,当然我没有具体做。
2 学习伙伴
一般而言,综述性论文或者书籍是学习一个方向的好伙伴,这里推荐一本书:Multiple instance learning foundations and algorithms,其囊括了16年以前关于多示例学习的发展历程、应用领域、前沿算法、实验手段等,其封面如下:
温馨提示:本书原版收费,请自行寻找资源下载。如果它不起作用,私法会给我你的电子邮件地址,但我会发给你。
2.1 关于这本书的使用
主要用作说明书之类的,当然,如果你能在一个月内快速看完,无疑对你有很大的帮助。
2.2 不同方向的多示例方法
简单划分:
它主要分为两类。传统的方法是分析数据的结构,设计一套优化方法。目前主要研究基于embedding的方法,其他的词我会简单提一下。
2.2.1 基于实例的方法
看学习伙伴的书,很清楚。
2.2.2 基于包的方法
入门文章:Multi-instance learning by treating instances as non-I.I.D。samples
提示:不要直接看我的博客,自己看文章,以后再看。
进阶文章:Isolation set-kernel and its application to multi-instance learning
这篇文章提到了一个距离度量,但是它的后续处理方法是基于embedding的方法。当然,这更难阅读和跳过。
2.2.3 基于嵌入的方法
开山之作:Multi-instance clustering with applications to multi-instance prediction
进阶文章:Multi-instance learning with discriminative bag mapping
2.2.4 网络方法
在这种情况下,可以阅读传统的方法,也可以阅读具有多个示例的方法。推荐两篇文章:
注意力机制:Attention-based deep multiple instance learning
损失注意力:Loss-based attention for deep multiple instance learning
3 资源库
3.1 数据集
https://blog.csdn.net/weixin_44575152/article/details/104769348
3.2 代码
我的Github复现了一些,地址在本人置顶博客中,其他的自己找,一般都是开源,推荐自己先复现。
3.3 大佬主页
周志华老师:http://129.211.169.156/publication/index.html?authors=Zhi-Hua%20Zhou
4 论文阅读
将它们按顺序排列,并且您还需要记录每篇文章。建议每周至少有一篇文章。
4.1 摘要
先阅读这篇文章,并记下其他人的主要观点,例如背景、提出的问题、手段等。
4.2 算法
一般来说,介绍是吹牛,相关作品是对大哥的致敬。除了早期的理解和论文的写法,直接略过。
算法部分是文章的精髓,其中包含的一些技术甚至可以转化为自己学习的武器。尤其是在准备转载这篇文章的时候,更需要仔细研究。
小贴士:别人画的图需要自己学习,方便以后自己画的时候使用。
4.3 实验
重点记录别人的实验方法、实验数据、对比算法。
5 代码能力
推荐:精通Python和类似于C、C++这样的语言。
说明:Python方便实验、C等方便学习算法的思想。
5.1 书籍推荐
1)机器学习实战;
2)Pytorch中文教程。
当然这些的前提是你对python有一定的了解。
5.2 算法复现
尝试自己重现算法,这是您在后续实验中可能使用的。
6 学习路线图
版权声明:本文为博主因吉原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/weixin_44575152/article/details/123296800