PaddlePaddle深度学习知识

分组卷积

对于尺寸为 𝐻1×𝑊1×𝐶1
的输入矩阵,当标准卷积核的尺寸为 ℎ1×𝑤1×𝐶1
,共有 𝐶2
个标准卷积核时,标准卷积会对完整的输入数据进行运算,最终得到的输出矩阵尺寸为 𝐻2×𝑊2×𝐶2
。这里我们假设卷积运算前后的特征图尺寸保持不变,则上述过程可以展示为 图1 。

Standard Convolution Image

分组卷积则是针对这一过程进行了改进。分组卷积中,通过指定组数 𝑔
来确定分组数量,将输入数据分成 𝑔
组。需要注意的是,这里的分组指的是在深度上进行分组,输入的宽和高保持不变,即将每 𝐶1𝑔
个通道的数据分为一组。因为输入数据发生了改变,相应的卷积核也需要进行对应的变化,即每个卷积核的输入通道数也就变为了 𝐶1𝑔
,而卷积核的大小是不需要改变的。同时,每组的卷积核个数也由原来的 𝐶2
变为 𝐶2𝑔
。对于每个组内的卷积运算,同样采用标准卷积运算的计算方式,这样就可以得到 𝑔
组尺寸为 𝐻2×𝑊2×𝐶2𝑔
的输出矩阵,最终将这 𝑔
组输出矩阵进行拼接就可以得到最终的结果。这样拼接完成后,最终的输出尺寸就可以保持不变,仍然是 𝐻2×𝑊2×𝐶2
。分组卷积的运算过程如 图2 所示。

Standard Convolution Image