如何解决深度学习-功能金字塔网络-如何理解降采样表示法?
我对功能金字塔网络(FPN)架构中的下采样过程的表示法有疑问。我不确定堆栈溢出是否实际上是此问题的最佳选择。因此,关于更好的地方的任何提示都非常受欢迎。
我的问题最好用以下FPN原始作者之一的演讲来说明:
来源:http://presentations.cocodataset.org/COCO17-Stuff-FAIR.pdf,幻灯片11
1和1/4的比例注释对我来说很有意义。显然,我们从完整比例开始,经过一个合并步骤,我们的比例为1/4,因为我们在x和y方向上缩小了2倍。但是据我了解,按照相同的逻辑,在下一个阶段(即下一个合并之后),我们的比例应该为1/16。下一步执行完1/64等之后,我会丢失什么?
解决方法
一个轮询步骤后,您将获得1/2的比例,而不是1/4。比例表示沿轴的变化,而不是面积比。 那么,为什么一开始会有1/4的变化呢? 如幻灯片11所示,工程图引用到resnet / resnext模型。如果我们看一下resnet模型的体系结构,我们可以看到首先我们使用 stride 2 对7x7进行了卷积,然后我们使用 stride 2 进行了轮询。每轴减少1/4。 在接下来的阶段中,我们只有步幅为2的轮询,因此只能得到因子2的变化。即1 / 8、1 / 16 1/32。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。