Skip to content

卷积

卷积(Convolution)是两个函数(或两个向量)之间的一种数学运算,广泛应用于信号处理、图像处理、概率论和深度学习等领域。

20 世纪初 Doetsch 在拉普拉斯变换的框架下正式命名了”卷积”(Faltung)

两个连续函数 的卷积定义为:

两个离散序列 的离散卷积定义为:

在有限长序列的实践中,求和仅在非零区间上进行。

卷积的物理意义可以理解为:一个函数经过翻转和平移后与另一个函数的重叠积分

具体步骤:

  1. 翻转:将 翻转为
  2. 平移:将翻转后的函数向右平移 ,得到
  3. 相乘:计算
  4. 积分:对所有 积分,得到

换个角度,卷积可以理解为 “加权叠加”:用 作为权重,对 的过去(或周围)进行加权平均。这就是为什么在深度学习中,卷积层本质上是使用一个可学习的核(kernel)对输入进行加权求和。

卷积定理建立了卷积与傅里叶变换之间的桥梁:

即时域中的卷积等价于频域中的逐点乘法。反之亦然:

这一定理极大地简化了计算——在频域做乘法比在时域做卷积快得多(特别是借助 FFT)。

两个宽度相同的矩形函数卷积得到一个三角形函数:

其中

两个高斯函数的卷积仍然是高斯函数:

这说明高斯核对高斯核的卷积不会产生新的函数形式——这也是高斯模糊可以多次叠加的原因。

线性时不变系统(LTI):系统的输出 是输入 与系统冲激响应 的卷积:

这是整个信号处理领域的基石。

图像卷积使用一个较小的核(kernel)滑动遍历图像:

  • 模糊:使用均值核或高斯核
  • 锐化:使用拉普拉斯核
  • 边缘检测:使用 Sobel 算子、Canny 算子

对于二维图像 和核

两个独立随机变量 的和 的概率密度函数为:

深度学习:卷积神经网络(CNN)

Section titled “深度学习:卷积神经网络(CNN)”

卷积层是 CNN 的核心,利用可学习的卷积核提取局部特征:

  • 局部连接:每个神经元只连接输入的局部区域
  • 权重共享:同一个卷积核在整个输入上滑动
  • 平移等变性:输入平移导致输出也平移

这些特性使 CNN 在图像分类、目标检测、语义分割等任务中表现出色。

卷积与互相关(cross-correlation)相似但不同:

区别在于卷积需要对 进行翻转,而互相关不需要。在深度学习中通常所说的”卷积”实际实现的是互相关(没有翻转),因为翻转对可学习的核来说没有区别。

t1