如何解决自训练 HAAR 分类器导致准确率低得令人失望 负样本正样本矢量培训结果问题
我正在尝试使用 OpenCV 2.4 训练一个 HAAR 分类器来检测壁球拍的头部。 不幸的是,准确性方面的结果相当糟糕,我想了解我的过程的哪一部分存在缺陷。在这一点上,我不担心性能,因为我不会将其用作实时检测器。
负样本
正样本
我一共创建了4168个正样本,其中
- 168 是手动注释的游戏记录镜头
- 4000 是使用 opencv_createsamples 创建的样本
opencv_createsamples -img img/sample/r2_white.png -bg img/neg.txt -info img/generated/info.txt -pngoutput img/generated -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85 -num 4000
我使用了相对较高的最大角度,因为我觉得这更能代表壁球拍在比赛录音中的表现。
矢量
将手动标注的和生成的样本的标注合并后,我创建了带有以下参数的向量:opencv_createsamples -info img/pos_all.txt -num 4168 -w 25 -h 25 -vec model/vector/positives_all.vec -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85
培训
我使用以下参数训练了模型。再次添加 -mode ALL 因为我觉得功能的旋转会更能代表现实世界的壁球游戏。opencv_traincascade -data ../model -vec ../model/vector/positives_all.vec -bg neg.txt -numPos 3900 -numNeg 7000 -numStages 10 -w 25 -h 25 -numThreads 12 -maxFalseAlarmRate 0.3 -mode ALL -precalcValBufSize 3072 -precalcIdxBufSize 3072
训练总共花费了大约 10 个小时,但即使在最后阶段的第 100 个样本中,误报仍然是 0.84(前提是我正确解释了训练输出)。 在第 5 阶段结束时最低为 0.74。
====== 9 阶段训练 =====
POS 数量:消耗 3900:4095
NEG 计数:acceptanceRatio 7000:0.0304295
预计算时间:16
N | 人力资源 | FA |
---|---|---|
1 | 1 | 1 |
2 | 1 | 1 |
3 | 1 | 1 |
4 | 1 | 1 |
5 | 1 | 1 |
6 | 1 | 1 |
7 | 1 | 0.998857 |
... | ... | ... |
98 | 0.995128 | 0.840857 |
99 | 0.995128 | 0.850571 |
100 | 0.995128 | 0.842714 |
结束>
结果
分类器似乎做得不好,也有大量的误报和漏报。
我尝试了 minNeighbors 和 scaleFactor 参数,但无济于事。在下面的情况下,我使用的是 detectMultiScale(gray,2,75)
:
问题
- 我的用例是否现实?是否有任何原因使球拍特别难以被发现?
- 我的阳性样本是否足够?
- 生成的样本中的角度或缺少透明背景是否有问题?
- 还是手动注释到生成的样本 (168:4000) 的比例不够?
- 用于训练的正负样本比例 (3900:7000) 是否足够?
- 我的培训方法是否合适?
- 我的训练参数(例如球拍形状中的特征高度/宽度)有什么问题吗?
- 我的误报率在训练期间停滞不前的原因是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。