【论文阅读】Multi-instance Learning with Discriminative Bag Mapping

基本信息

· 题目:Multi-instance Learning with Discriminative Bag Mapping
· 会议:IEEE

摘要

目前,通过选择一个实例将一个包转化为一个新空间中的单个实例,主要是基于原始空间。但是基于原始空间的映射有一些缺陷,如:难以保证所选实例的识别能力。因此,允许一组实例共享一个标签,是解决学习中标签歧义问题的有效工具。本文提出了一种用于多示例学习的判别映射方法,旨在识别最佳实例,从而直接区分新映射空间中的包。

介绍

在有监督学习中,每一个训练样本都是一个带有类标签的实例;与有监督学习相比,多示例学习中的每一个训练样本则是一个含有多个实例的包,每个包都带有类标签。标签是分配给包的而不是给实例的。
若一个包是负包,那么该负包中的所有实例都是负的;但对于正包来说,包中至少有一个实例时正的。
现有的MIL方案主要分为两类:①改进传统的学习算法来解决标签歧义问题;②开发专门用于多示例学习的学习范式。但以上两种方案无法在包中含有大量实例的情况下呈现出优越的性能
因此,本文提出一种用于多示例学习的直接判别映射方法,旨在识别那些能够使包在新的映射空间中能够被明显区分的实例。

相关工作

当数据集较庞大时,算法需要处理大量的实例。在这种情况下,选择那些最具代表性的实例来代表包就成为了一个具有挑战性的问题。解决这类问题的一种新方法是:使用那些在包中选择的实例,并将MIL问题转换为标准的单实例学习问题。我们将这些方法称为“基于实例选择的MIL”。可以将它们分为两类:①基于实例选择的非包映射方法;②基于实例选择的包映射方法。

①非包映射方法

该方法的基本思想是:从每个包中选出一个或多个实例来表示整个包。直接将包标签映射给包中的所有实例,让所有实例来表示包。但由于包中大部分信息都被丢弃,这种方法往往面临信息丢失和分类性能下降的问题

②包映射方法

选择一组实例原型,将包映射到一个新的特征空间。

符合与算法框架

本文符号表如下:

符号含义
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping训练集
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping包数量
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个包
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping标签
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping实例集
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个包中的第【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个实例
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping实例空间大小
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping判别实例池(Discriminative Instance Pool, DIP)
【论文阅读】Multi-instance Learning with Discriminative Bag MappingDIP大小
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping包映射
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping【论文阅读】Multi-instance Learning with Discriminative Bag Mapping与映射后的实例【论文阅读】Multi-instance Learning with Discriminative Bag Mapping的相似度

一个包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping包含许多实例,实例【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示在第【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个包中的第【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个实例。用【论文阅读】Multi-instance Learning with Discriminative Bag Mapping来表示包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping的标签。
在训练的过程中,所有的包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping都通过discriminative instance pool(DIP)转换称为一个新的特征空间中的一个单实例【论文阅读】Multi-instance Learning with Discriminative Bag Mapping。我们将DIP通过【论文阅读】Multi-instance Learning with Discriminative Bag Mapping来表示。
在测试过程中,先通过DIP将每一个包映射为特征空间中新的实例,然后利用训练好的分类器来预测最终的类标签。该过程中最关键的一部分就是找到最优的用于包映射的DIP(discriminative instance pool)

DIP(discriminative instance pool) Optimization

DIP优化目标为:使用一个实例选择矩阵【论文阅读】Multi-instance Learning with Discriminative Bag Mapping(一种对角矩阵,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping )来找到一个子集【论文阅读】Multi-instance Learning with Discriminative Bag Mapping。而【论文阅读】Multi-instance Learning with Discriminative Bag Mapping是一个启示向量。若【论文阅读】Multi-instance Learning with Discriminative Bag Mapping,那么【论文阅读】Multi-instance Learning with Discriminative Bag Mapping,否则【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
我们定义【论文阅读】Multi-instance Learning with Discriminative Bag Mapping作为实例评估函数,用于评价子集【论文阅读】Multi-instance Learning with Discriminative Bag Mapping的质量。表达式如下:
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示实例集的基数,而【论文阅读】Multi-instance Learning with Discriminative Bag Mapping为从实例集【论文阅读】Multi-instance Learning with Discriminative Bag Mapping中选出的实例数量。

DIP评价标准

为了能够得到具有一定鉴别实例能力的DIP,引入以下两个规则:
bag mapping must-link:由于每一个包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping都带有一个正或负类标签,因此DIP必须确保在另一个映射空间中的包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping标签与包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping标签一致;
bag mapping cannot-link:在映射空间中带有不同类别标签的包应该代表它们之间的差异;
DIP评价标准可以表示为:
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示通过DIP得到的新的映射空间中包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping与包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping之间的距离。【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示映射空间的区别程度。【论文阅读】Multi-instance Learning with Discriminative Bag Mapping能够表示为:
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping【论文阅读】Multi-instance Learning with Discriminative Bag Mapping一样都使用了所有实例作为映射实例池。将标签嵌入矩阵【论文阅读】Multi-instance Learning with Discriminative Bag Mapping定义为:
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示bag mapping must-link的包集;【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示bag mapping cannot-link的包集。
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping的推导过程如下:

其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping表示矩阵迹算子,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping【论文阅读】Multi-instance Learning with Discriminative Bag Mapping代表包的大小。【论文阅读】Multi-instance Learning with Discriminative Bag Mapping是对角矩阵,它由矩阵【论文阅读】Multi-instance Learning with Discriminative Bag Mapping产生。【论文阅读】Multi-instance Learning with Discriminative Bag Mapping是拉普拉斯(Laplacian)矩阵,由矩阵【论文阅读】Multi-instance Learning with Discriminative Bag Mapping产生,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping可以表示为【论文阅读】Multi-instance Learning with Discriminative Bag Mapping。通过函数【论文阅读】Multi-instance Learning with Discriminative Bag Mapping来表示【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
最开始的优化问题可以转化为求使函数【论文阅读】Multi-instance Learning with Discriminative Bag Mapping得到最大和的实例映射集合【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
DIP算法流程如图所示:

通过DIP实现包映射

一旦使用选择好的实例构建DIP,每个包都需要映射到新空间中的单个实例。给定一个DIP判别实例池【论文阅读】Multi-instance Learning with Discriminative Bag Mapping,该DIP中有【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个实例,包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping能够映射为一个实例【论文阅读】Multi-instance Learning with Discriminative Bag Mapping,而【论文阅读】Multi-instance Learning with Discriminative Bag Mapping代表包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping与示例【论文阅读】Multi-instance Learning with Discriminative Bag Mapping之间的相似度,表示为:
【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
其中,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping代表在第【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping中的第【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个实例,【论文阅读】Multi-instance Learning with Discriminative Bag Mapping为预设的比例因子。通过优化的DIP,每一个包【论文阅读】Multi-instance Learning with Discriminative Bag Mapping都映射为【论文阅读】Multi-instance Learning with Discriminative Bag Mapping
映射算法又分为两类:①Global DiscriminativeBag Mapping;②Local Discriminative Bag Mapping

①Global DiscriminativeBag Mapping

这种映射方法是通过计算所有包中的每一个实例到DIP中的前【论文阅读】Multi-instance Learning with Discriminative Bag Mapping个实例间的距离进行计算。
·aMILGDM:使用所有的训练集包来产生全局DIP
·pMILGDM:仅使用正包

② Local Discriminative Bag Mapping

这种映射方法计算了包中的每一个实例并选出一个具有最高识别分数的实例。
·aMILLDM:从每一个包中找出具有最高识别分数的实例
·pMILLDM:从每一个正包中找出具有最高识别分数的实例

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
扎眼的阳光的头像扎眼的阳光普通用户
上一篇 2022年5月19日
下一篇 2022年5月19日

相关推荐