如何解决对于固定尺寸的图像,我应该保留CNN输入的比率吗?
我发现了很多主题,询问是应该填充还是仅调整输入到CNN的输入的大小。我使用Resnet18,但问题的答案不应取决于CNN架构。
人们倾向于建议保持输入的宽高比,但主要是针对与可变大小的输入图像有关的问题。我想这是很合逻辑的,因为人们不希望功能以输入大小的多种方式失真,因此一个填充然后调整大小。但是,对于固定大小的输入是否仍然适用?我会说不,因为对所有图像都将以相同的方式执行大小调整操作。我认为无需填充-调整大小后的图像对人眼来说似乎很奇怪,但我真的认为该模型无关紧要。 信息将以何种方式丢失?我什至会更进一步地说,只要拉伸是对人类可感知的数据和转换进行标注的,无论拉伸的坡度是否馈入神经网络。操作对于所有图像都是恒定的,NN应该执行相同的操作。
我自己在一组约5:1比例的图像上进行了测试,这些图像大小均相同,并且请勿填充,调整大小比填充,调整大小效果更好em>,这与我的理论并不矛盾。
有人写了磁共振成像,并坚持这样一个事实:“由于图像是正交的,他不能像通常那样调整大小-他必须垫以保持比率”。 请告诉我您是否有示例,其中填充固定尺寸的图像效果更好。
无论如何,我知道最好的办法是总是尝试两种方法,但是我想了解潜在的原因!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。