基本概念
- Permutation Invariant:指的是特征之间没有空间位置关系
- Pooling(池化):是卷积神经网络中的一个重要的概念,它实际上是一种形式的降采样。多种不同形式的非线性池化函数,而其中“最大池化(Max pooling)”是最为常见的。它是将输入的图像划分为若干个矩形区域,对每个子区域输出最大值。直觉上,这种机制能够有效的原因在于,在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合
实例级别:是一个实例级别的分类器,返回值为每个实例的分数,则是判别函数。
嵌入级别:将实例映射为一个低维嵌入;MIL池化用于获取包的表示。
MIL池化
最大池化层:
最大池化层:
注意力机制
表示包的嵌入,MIL的嵌入为:
其中:
门控注意力机制:
文章出处登录后可见!
已经登录?立即刷新