在这之前,我们要先明确,卷积神经网络的本质是特征的提取,如何提取高质量的特征,是重中之重,而不同深度的层对于特征的提取是不同的。其中,浅层网络负责提取基础特征,比如边缘,轮廓等,深层网络提取抽象特征,更像是基础特征的组合。对于分类网络,通常最后一层会跟着一个全连接层,对这些特征进行组合,以评分分类。
针对此,我们在进行模型设计的原则,通俗点讲就是deeper and deeper,wider and wider,深度是针对于网络层而言,而宽度是指针对某一层所对应的模型输出通道数。
一般而言,模型层数越多,所提取的抽象特征所具有的表达能力就会越强,因为他们能够学到更加复杂的表达。想象一下,如果模型只有一层,那就意味着所要学习的变换会非常的复杂,这很难做到。
而模型越深,可以缓解每一层的压力,不必要去过度拟合。而如果模型更宽,可以让每一层学习到更加丰富的特征,比如不同方向,不同频率的纹理特征。