如何解决如何使用Tesseract / Python使用.png中的坐标提取文本?
我正在尝试给我的脚本“ X”坐标,我要检索的文本在哪里,以后用该文本命名.png。关键是脚本会读取整个.png并给我所有文本。我需要给脚本一个坐标(我有),然后只检索我正在寻找的单词
import os
import cv2
import PyTesseract
import numpy as np
from PIL import ImageGrab
import time
PyTesseract.PyTesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img = cv2.imread('example-1.png')
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
resultado = print(PyTesseract.image_to_string(img))
#############################################
#### Detect characters ######
#############################################
hImg,wImg,_ = img.shape
Boxes = PyTesseract.image_to_Boxes(img)
for b in Boxes.splitlines():
# print(b)
b = b.split(' ')
# print(b)
x,y,w,h = int(b[1]),int(b[2]),int(b[3]),int(b[4])
cv2.rectangle(img,(x,hImg- y),(w,hImg- h),(50,50,255),2)
cv2.putText(img,b[0],hImg- y+25),cv2.FONT_HERShey_SIMPLEX,1,2)
print(b)
cv2.imshow('img',img)
cv2.waitKey(0)
.png中单词的坐标是这些
['183','2157','203','2197','0']
['230','250','2199','0']
['254','274','2187','0']
['301','319','0']
['324','345','0']
['352','362','0']
['376','386','0']
['395','415','0']
谢谢!问候。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。