在AlexNet中,图像数据是3*224*224
。
第一卷积层使用 96 个大小为11*11*3
的内核以 4 个像素的步幅对图像进行滤波。
我怀疑第一层的输出神经元计数。
在我看来,输入是224*224*3=150528
,那么输出应该是55*55*96=290400
但在论文中,他们描述的输出是253440
如何计算这一层的神经元的数量?
好像输入大小是 227x227,没有填充。我也认为他们在论文中提到的是一个错误。看看这个链接。
http://cs231n.github.io/convolutional-networks/它提到:
Krizhevsky 等人。在 2012 年赢得 ImageNet 挑战的这个已知的架构中,除了一个额外的 2x96 x3 个神经元的输入之外,它显然是一个大小为 [227x227x3] 的整数。在第一个卷积层上,它使用了感受域大小为 F = 11,步幅 S = 4 且没有零填充 P = 0 的神经元。由于(227-11)/ 4 1 = 55
我也相信这是作者的一个错误,我在the courseware of stanford cs231n中找到了一个证明,在第 10 页和第 11 页中,你可以找到第一个 conv 的输出大小是 290400。
本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处
评论列表(72条)