Skip to content

Lesson-20

卷积层中的填充与步幅

填充

为什么要填充? 当我们给定卷积核,假设为\((h, w)\),输入的矩阵假设原来为\((H, W)\),那么会变为\((H-h+1, W-w+1)\)。假设多用了很多次,就会变得很小而无法再用卷积层了。 怎么填充? 在输入的外围添加上额外的行和列,如下图所示:alt text 我们填充\(p_h\)行和\(p_w\)列,一般取\(p_h = k_h -1\)\(p_w = k_w - 1\),然后对称着填充。

步幅

经过卷积核减小的输出的大小与层数线性相关,如果我们希望把一个较大的图片转换成一个较小的图片,我们可能需要经历很多计算,所以引入步幅来减少计算量。

  • 步幅指的是窗口滑动的步长
  • 下面的例子为高度为3,宽度为2的步幅:alt text 输出会变成一个\(2 \times 2\)的矩阵
  • 给定高度\(s_h\)和宽度\(s_w\)的步幅,输出的形状是:
\[G((n_h-k_h+p_h+s_h)/s_h) \times G((n_w-k_w+p_w+s_w)/s_w)\]

其中:\(G(x)\)表示的是 \(x\) 向下取整