如何解决获取图像中每个字母的矩形边界 一个像素的能量计算
所以我试图用图像文件中每个字母的边界填充ArrayList<Rectangle>
。
例如,给定这张.png
图片:
我想用14个ArrayList<Rectangle>
(每个字母一个矩形)填充一个Rectangle
我们可以假设图像仅包含两种颜色,一种用于背景,一种用于字母,在这种情况下,像素将是白色或红色。
起初,我以为我可以搜索字母之间的白列,然后,如果我发现了一个全白列,我可以通过获取最低的红色像素值和最高的红色像素值来获得宽度,{ 1}},依此类推:
width = maxX-minX
问题在于字母之间没有空格,甚至没有1个像素:
我的下一个想法是,对于找到的每个红色像素,寻找一个尚未被发现的邻居,然后,如果我找不到一个邻居,我将拥有所有像素来获取该字母的边界。但是通过这种方法,我将获得2个矩形,用于像“ i”这样的字母,然后我可以编写一些算法来合并这些矩形,但是我不知道如何将其与其他多部分字母合并,在尝试之前,我想在这里问更多的想法
那么你们有什么想法吗?
解决方法
您可以使用OpenCV cv2.findContours()
函数。不用使用cv2.drawcontours()
函数绘制轮廓(突出显示字母的轮廓),而是可以使用cv2.rectangle
并从{{1 }}功能。
如果不使用像OpenCV这样的库,我认为两步算法就足以解决问题。
- 直方图
- 接缝计算
1。直方图
C.....C..C...
.C.C.C...C...
. C.C....CCCC
1111111003111
- 点(
.
)表示背景颜色(白色) -
C
表示背景颜色以外的任何颜色(在您的情况下为红色)
累计非背景颜色的垂直像素数会生成直方图。
*
*
******..****
0123456789AB
很明显,边界存在于6和7
2。接缝计算
由于完全没有空的垂直线,因此无法通过直方图解决We
之类的情况。
接缝雕刻算法为我们提供了一些提示
更详细的实现见
一个像素的能量计算
红色数字不是像素的颜色值,而是从相邻像素计算出的能量值。
3。在更多...
需要统计数据来确定是否应用接缝雕刻。
- 最大和最小字符宽度
即使直方图为我们提供了垂直边界,也不清楚一个组中是否有两个或多个字符。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。