SKnet论文解读

xiaoxingxing

3 年前

本文讲述sknet的核心部分:自适应性的注意力编码机制

SKNet对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理

注：本人天赋和知识很少，文章难免有疏漏。仅供初学者阅读和交流。

开始前的题外话

说来也算有趣,最近读了几个关于CV领域的paper,有的号称其idea来源于神经科学,比如SIM-AM的三维特征推断(这个其实没怎么看懂),言归正传,我们看一看sknet吧

1.神经科学背景

比如说inception模型的’宽度’

于是提出了sknet,不同大小的感受视野（卷积核）对于不同尺度的目标会有不同的效果。尽管 Inception 这样的增加了多个卷积核来适应不同尺度图像，但是卷积核权重相同,参数就是被计算好的了.SKNet对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理

sknet网络主要由 Split、Fuse、Select 三部分组成。

原文:’为了使神经元能够自适应地调整它们的 RF 大小，我们提出了一种自动选择操作，即“选择性内核”（SK）卷积，在具有不同内核大小的多个内核中。具体来说，我们通过三个运算符实现 SK 卷积——Split、Fuse 和 Select，如图 1 所示，其中显示了两个分支的情况。因此在这个例子中，只有两个内核大小不同的内核，但是很容易扩展到多个分支的情况。’