微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用Tesseract / Python使用.png中的坐标提取文本?

如何解决如何使用Tesseract / Python使用.png中的坐标提取文本?

我正在尝试给我的脚本“ X”坐标,我要检索的文本在哪里,以后用该文本命名.png。关键是脚本会读取整个.png并给我所有文本。我需要给脚本一个坐标(我有),然后只检索我正在寻找的单词

import os
import cv2
import PyTesseract
import numpy as np
from PIL import ImageGrab
import time


PyTesseract.PyTesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
img = cv2.imread('example-1.png')
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
resultado = print(PyTesseract.image_to_string(img))

#############################################
#### Detect characters ######
#############################################
hImg,wImg,_ = img.shape
Boxes = PyTesseract.image_to_Boxes(img)


for b in Boxes.splitlines():
    # print(b)
    b = b.split(' ')
    # print(b)
    x,y,w,h = int(b[1]),int(b[2]),int(b[3]),int(b[4])
    cv2.rectangle(img,(x,hImg- y),(w,hImg- h),(50,50,255),2)
    cv2.putText(img,b[0],hImg- y+25),cv2.FONT_HERShey_SIMPLEX,1,2)
    print(b)

cv2.imshow('img',img)
cv2.waitKey(0)

.png中单词的坐标是这些

['183','2157','203','2197','0']
['230','250','2199','0']
['254','274','2187','0']
['301','319','0']
['324','345','0']
['352','362','0']
['376','386','0']
['395','415','0']

谢谢!问候。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。