Skip to content

Lesson-25

VGG

AlexNet 的结构看上去很“随意”,但是它比 LeNet 的性能更好是因为更深更宽启示我们去构造更大的网络。

VGG 块: 每个 VGG 块中间都堆很多个\(3\times 3\)卷积层,最后一个池化层:alt text

VGG 架构: 堆积了多个 VGG 块,最后是全连接层。根据中间 VGG 块的个数,有不同的架构:VGG-16、VGG-19...alt text

VGG 架构中采用不同数量的 VGG 块的思想启发了后面不同模型都有变种(比如LLaMA-7B、LLaMA-72B...)