我试图识别一个图像(forms)和转换成文本,目前使用从谷歌“tesseract-ocr”egg.trained数据,这对打印的字符和手动书面(手工人写)我工作得很好数据,这对我训练的人物来说很好。 无论我想合并这两个训练的数据(tesseract-ocr +我自己的训练数据),所以我可以识别手写和打印字符在一个单一的forms,请让我知道如何将这两个文件合并成一个。
Java如何规避Windows MAX_PATH WinAPI限制
Java上的便携式应用程序使用networking摄像头
AccessControlException:访问被拒绝 – FilePermission
如何在Jenkins上设置LD_LIBRARY_PATH
在Windows下debuggingJVM崩溃
不需要合并它们。 Tesseract 3.02支持多种语言的识别 – 例如,您可以指定“egg + eng + blah”作为-l选项的值。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。