如何解决解释立体声匹配解决方案的准确性
我有两张相同的物体的照片,它们是由沿着道路行驶的汽车拍摄的,如下图的右侧所示。我想在每个帧中找到彼此对应的对象像素。
现在,在Middlebury Stereo Evaluation v.3数据集的描述中
在全分辨率下,最大视差范围为200到800像素。
这使我想到了两个问题:
- 我是否正确理解,与Middlebury数据集配合使用的算法必须匹配相距200至800像素的像素,如图像左侧所示?
- 考虑leaderboard用于Middlebury立体声评估。平均绝对误差度量值为1.4是否意味着可以为数据集中平均精度为1.4像素的图像解决以上问题?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。