3D卷积神经网络详解

Table of Contents

1 3d卷积的官方详解

2 2D卷积与3D卷积

1）2D卷积

2D卷积：卷积核在输入图像的二维空间进行滑窗操作。

2D单通道卷积

对于2维卷积，一个3*3的卷积核，在单通道图像上进行卷积，得到输出的动图如下所示：

2D多通道卷积

在之前的2D单通道的例子中，我们在一张图像上使用卷积核进行扫描，得到一张特征图。这里的“被扫描图像”是一个通道，而非一张彩色图片。如果卷积核每扫描一个通道，就会得到一张特征图，那多通道的图像应该被怎样扫描呢？会有怎样的输出呢？

在一次扫描中，我们输入了具有三个通道的彩色图像。对于这张图片，分别在三个通道上扫描三个大小相同但具体值不同的卷积核，产生对应的三个“新通道”。由于同一张图像中不同通道的结构必须相同，而且卷积核的大小也相同，所以卷积运算后得到的“新通道”的大小也是相同的。

得到三个“新通道”后，我们将对应位置的元素相加，形成一个新的图像，即卷积层输入的三色图像的第一个特征图，如下图：

这个操作对于三通道的RGB图像、四通道的RGBA或者CYMK图像都是一致的。只不过，如果是四通道的图像，则会存在4个同样尺寸、但数值不同的卷积核分别扫描4个通道。

因此，在一次扫描中，无论图像本身有几个通道，卷积核会扫描全部通道之后，将扫描结果加和为一张 feature map。所以，一次扫描对应一个feature map，无关原始图像的通道数目是多少，所以 out_channels就是扫描次数，这之中卷积核的数量就等于输入的通道数in_channels x 扫描次数 out_channels。

2D卷积的计算：

输入层：（Cin 为输入的通道数）