如何解决与.NET TPL一起使用时,OMP_THREAD_LIMIT对Tesseract速度没有影响
我们正在生产前评估tesseract OCR。 我们已经安装了tesseract exe(C ++),并计划使用TPL通过.NET进程进行调用。
由于将有多个输入图像,因此具有16个核心Windows机器,并计划将TPL的MaxDegreeOfParallism设置为与核心数相同,即16个以快速处理图像并尽可能多地利用CPU
从Tesseract文档中可以得知,“ Tesseract使用4个线程进行OCR处理”。
我们的理解是Tesseract使用4个线程进行单图像OCR处理。
因此,我们以以下2种情况执行了.NET POC应用程序-
1.输入图像= 100,OMP_THREAD_LIMIT = 4,MaxDegreeOfParallism = 16
2.输入图像= 100,OMP_THREAD_LIMIT = 1,MaxDegreeOfParallism = 16
但是发现速度几乎相同。我们看不到OMP_THREAD_LIMIT的影响。如果您知道使用tesseract加速数百万张图像的OCR处理的更好方法,请提出建议?
致谢
维杰
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。