python EasyOCR库实例用法介绍

说明1、EasyOCR是一个用python编写的OCR三方库。可以在python中调用,用来识别图像中的文字,并输出为文本。

2、支持80多种语言的识别,识别精度高,甚至要超过PaddleOCR。

安装命令pip install easyocr代码实现

import easyocr #设置识别中英文两种语言reader = easyocr.Reader([’ch_sim’,’en’],gpu = False) # need to run only once to load model into memoryresult = reader.readtext(r"d:Desktop4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png",detail = 0)print(result)

实例扩展:

图文提取的代码

from pathlib import Pathimport easyocrfile_url = r’识别图片.jpg’ # 需识别的图片split_symbol = ’ ’ # 默认空格为分隔符row_space = 15 # 默认字符高度为15px,当识别出来的字符间距超过这个数值时会换行。def make_reader(): # 将模型加载到内存中。模型文件地址 C:Users用户.EasyOCRmodel reader = easyocr.Reader([’ch_sim’,’en’]) return readerdef change_to_character(file_url,reader,split_symbol=’ ’,row_space=15,save_dir=’.’): with open(file_url,"rb") as img: img_b = img.read() result = reader.readtext(img_b) result.sort(key=lambda x: x[0][0][1]) # 按竖直方向,进行排序==>进行分行处理。 # for i in result: # print(i) # print(’=’*100) # 按行进行分组 content = [] item = [result[0]] # 首先放入第一个元素 for i in result[1:]: if row_space >= i[0][0][1] - item[-1][0][0][1] >= 0: item.append(i) else: content.append(item) item = [i] content.append(item) filemane = Path(file_url).name.split(’.’)[0] with open(f’{save_dir}/{filemane}.txt’,"w",encoding=’utf8’) as t: for i in content: # i 为每一行的内容 i.sort(key=lambda x: x[0][0][0]) # 对每行的内容进行先后排序 for r in i: # print(r) t.write(r[1] + split_symbol) t.write("n") return contentif __name__ == "__main__": change_to_character(file_url,make_reader())

UI 界面的代码

import tkinter as tkfrom tkinter import filedialogfrom PIL import Image,ImageTkfrom pathlib import Pathfrom character import change_to_character,make_readerfrom threading import Threadimport time# class Showing(tk.Frame):# def __init__(self,master=None):# super().__init__(master)# self.master = master# self.pack()# # self.img = tk.PhotoImage(file=r"C:UsersyanhyDesktop捕获22.PNG")# self.create_widgets()## def create_widgets(self):# self.img = tk.PhotoImage(file=r"C:UsersyanhyDesktop捕获22.PNG")# self.img_wig = tk.Label(self,image=self.img)# self.img_wig.pack()# 最外层窗口设置root = tk.Tk()root.title(’图片文字识别程序 联系:410889472@qq.com’)window_x = root.winfo_screenwidth()window_y = root.winfo_screenheight()WIDTH = 1200HEIGHT = 750x = (window_x - WIDTH) / 2 # 水平居中y = (window_y - HEIGHT) / 3 # 垂直偏上root.geometry(f’{WIDTH}x{HEIGHT}+{int(x)}+{int(y)}’)root.resizable(width=False,height=False)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》Row_space = 15File_url_list = []Img_type = [’.jpg’,’.jpeg’,’.png’,’.gif’]Split_symbol = ’ ’ # 间隔符。Save_dir = Path.cwd().joinpath(’img_to_word’)if Save_dir.is_dir(): passelse: Path.mkdir(Save_dir)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》def test(): print(f’{Row_space=}’)def choose_file(): # 获取导入的图片路径地址 global show_img,img_label,text,File_url_list filenames = filedialog.askopenfilenames() if len(filenames) == 1 and len(File_url_list) == 0: # 单张图片导入,显示图片 if Path(filenames[0]).suffix.lower() in Img_type: # 判断是否图片类型 File_url_list = list(filenames) try: if text.winfo_exists(): text.destroy() except NameError as e: print(f’choose_file提示:张图片导入错误>>> {e}’) try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f’choose_file提示:单张图片导入错误>>> {e}’) img = Image.open(File_url_list[0]).resize((560,660)) # print(img.size) show_img = ImageTk.PhotoImage(image=img) img_label = tk.Label(f_left,image=show_img) img_label.pack() else: print(’导入的是非图像格式’) else: # 多张图片导入,显示列表。 try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f’提示:多张图片导入错误>>> {e}’) try: if text.winfo_exists(): text.destroy() except NameError as e: print(f’提示:多张图片导入错误>>> {e}’) text = tk.Text(f_left,spacing1=5,spacing3=5) text.pack(fill=’both’,expand=True) for i in filenames: if Path(i).suffix.lower() in Img_type: File_url_list.append(i) else: pass File_url_list = set(File_url_list) for i in list(File_url_list): # 把文件写入到文本框中 text.insert(’end’,str(list(File_url_list).index(i)+1) + ": " + i + "n") File_url_list = list(File_url_list) print(f’{File_url_list=}’)def choose_dir(): global show_img,File_url_list directoryname = filedialog.askdirectory() print(f’{directoryname=}’) try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f’choose_dir提示:多张图片导入错误>>> {e}’) try: if text.winfo_exists(): text.destroy() except NameError as e: print(f’choose_dir提示:多张图片导入错误>>> {e}’) text = tk.Text(f_left,spacing3=5) text.pack(fill=’both’,expand=True) for i in Path(directoryname).iterdir(): # 获取文件夹下的所有文件。 if Path(i).suffix.lower() in Img_type: File_url_list.append(i.as_posix()) # as_posix() 把Path型转为字符串。 else: pass File_url_list = set(File_url_list) for i in list(File_url_list): # 把文件写入到文本框中 text.insert(’end’,str(list(File_url_list).index(i) + 1) + ": " + i + "n") File_url_list = list(File_url_list) print(f’{File_url_list=}’)def clear_file_list(): global File_url_list File_url_list.clear() try: if img_label.winfo_exists(): img_label.destroy() except NameError as e: print(f’clear_file_list提示:清空错误>>> {e}’) try: if text.winfo_exists(): text.destroy() except NameError as e: print(f’clear_file_list提示:清空错误错误>>> {e}’)def get_entry1(): # 设置换行间距变量值 global Row_space num = entry1.get() if num.isdigit(): if int(num) > 0: Row_space = int(num) else: entry1.delete(0,"end") entry1.insert(0,15) Row_space = 15def set_split_symbol(): global Split_symbol Split_symbol = entry2.get() print(f’{Split_symbol=}’)def do_change(): if File_url_list: v.set("文字提取中,请稍后……") button_do.config(state=’disable’) # 使按钮不可用。 # ======================================== def main(): reader = make_reader() for i in File_url_list: content = change_to_character(i,row_space=Row_space,split_symbol=Split_symbol,save_dir=Save_dir) read_text.delete(1.0,"end") for c in content: # i 为每一行的内容 c.sort(key=lambda x: x[0][0][0]) # 对每行的内容进行先后排序 for r in c: # print(r) read_text.insert(’end’,r[1] + Split_symbol) read_text.insert(’end’,"n") v.set("文字提取结束。") button_do.config(state=’normal’) # 恢复按钮可用。 # ======================================== t = Thread(target=main,daemon=True) t.start() else: v.set("请先选择图片!")def join_file(): v.set("文件开始合并。") filst = list(Path(Save_dir).iterdir()) # 获取文件夹中所有的文本文件。 with open(f’{Save_dir}/合并文件.txt’,’w’,encoding=’utf8’) as join_f: for f in filst: with open(f,’r’,encoding=’utf8’) as r_f: read_con = r_f.read() join_f.write(f.name+’n’+read_con + ’nn’) time.sleep(1) v.set("文件合并完毕。")# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》f_top = tk.Frame(root,height=65,width=1100,bd=1,relief="flat") # "sunken" "raised","groove" 或 "ridge"f_top.pack_propagate(False) # 如果不加这个参数,当Frame框架中加入部件时,会自动变成底层窗口,自身的特性会消失。f_top.pack(side=’top’,pady=5)f_left = tk.Frame(root,height=660,width=560,relief="groove")f_left.pack_propagate(False)f_left.pack(side=’left’,padx=20)f_right = tk.Frame(root,relief="groove")f_right.pack_propagate(False)f_right.pack(side=’left’,padx=20)read_text = tk.Text(f_right,spacing3=5)read_text.pack(fill=’both’,expand=True)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》button_choose_file = tk.Button(f_top,text=’选择图片’,command=choose_file)button_choose_file.pack(side=’left’,padx=10,ipadx=5)button_choose_file = tk.Button(f_top,text=’选择文件夹’,command=choose_dir)button_choose_file.pack(side=’left’,ipadx=5)button_clear_file = tk.Button(f_top,text=’清空选择’,bg=’#FFEF2F’,command=clear_file_list)button_clear_file.pack(side=’left’,padx=5,ipadx=5)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》f_row_content = tk.Frame(f_top,height=50,width=300,bg="#D1D4D0",relief="flat") # "sunken" "raised","groove" 或 "ridge"f_row_content.pack_propagate(False)f_row_content.pack(side=’left’,padx=15)button_set_row_height = tk.Button(f_row_content,text=’设置行间距’,command=get_entry1)button_set_row_height.pack(side=’left’,ipadx=3,padx=3)entry1 = tk.Entry(f_row_content,font=(’’,18),width=3)entry1.insert(0,15)entry1.pack(padx=5,side=’left’)tk.Label(f_row_content,justify=’left’,text=’填入像素值,设置换行间距。n默认15个像素。’).pack(side=’left’)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》f_split = tk.Frame(f_top,width=215,relief="flat") # "sunken" "raised","groove" 或 "ridge"f_split.pack_propagate(False)f_split.pack(side=’left’,padx=4)button_split = tk.Button(f_split,text=’设置分隔符’,command=set_split_symbol)button_split.pack(side=’left’,padx=3)entry2 = tk.Entry(f_split,width=3)entry2.insert(0,’ ’)entry2.pack(padx=5,side=’left’)tk.Label(f_split,text=’默认一个空格’).pack(side=’left’)# 《《《《《《《《《《《《《《《《《《《《《《 提取 合并文件 》》》》》》》》》》》》》》》》》》》》》》》》》button_do = tk.Button(f_top,text=’开始提取’,bg=’#4AB0FF’,command=do_change)button_do.pack(side=’left’,ipadx=2)button_join = tk.Button(f_top,text=’合并文件’,command=join_file)button_join.pack(side=’left’,ipadx=2)v = tk.StringVar()v.set(’info……’)tk.Label(f_top,bg=’#2EBD1D’,textvariable=v).pack(side=’left’)# 《《《《《《《《《《《《《《《《《《《《《《 右键菜单 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》def copy_text(): read_text.event_generate("<<Copy>>")menubar = tk.Menu(tearoff=False)# root[’menu’] = menubar # 没有把这个 菜单部件 加入到 root 窗口的菜单属性中,所以它不会在root窗口的顶部显示。menubar.add_command(label=’复制’,command=copy_text)def show_menu(event): """用 菜单部件 的 post 方法展示菜单""" menubar.post(event.x_root,event.y_root)read_text.bind(’<Button-3>’,show_menu)# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》root.mainloop()

到此这篇关于python EasyOCR库实例用法介绍的文章就介绍到这了,更多相关python EasyOCR库是什么内容请搜索编程之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程之家!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Python中的函数(二) 在上一篇文章中提到了Python中函数的定义和使用,在这篇文章里我们来讨论下关于函数的一些更深的话题。在学习C语言函数的时候,遇到的问题主要有形参实参的区别、参数的传递和改变、变量的作用域。同样在Python中,关于对函数的理解和使用也存在这些问题。下面来逐一讲解。一.函
Python中的字符串 可能大多数人在学习C语言的时候,最先接触的数据类型就是字符串,因为大多教程都是以&quot;Hello world&quot;这个程序作为入门程序,这个程序中要打印的&quot;Hello world&quot;就是字符串。如果你做过自然语言处理方面的研究,并且用Python
Python 面向对象编程(一) 虽然Python是解释性语言,但是它是面向对象的,能够进行对象编程。下面就来了解一下如何在Python中进行对象编程。一.如何定义一个类 在进行python面向对象编程之前,先来了解几个术语:类,类对象,实例对象,属性,函数和方法。 类是对现实世界中一些事物的封装,
Python面向对象编程(二) 在前面一篇文章中谈到了类的基本定义和使用方法,这只体现了面向对象编程的三大特点之一:封装。下面就来了解一下另外两大特征:继承和多态。 在Python中,如果需要的话,可以让一个类去继承一个类,被继承的类称为父类或者超类、也可以称作基类,继承的类称为子类。并且Pytho
Python中的函数(一) 接触过C语言的朋友对函数这个词肯定非常熟悉,无论在哪门编程语言当中,函数(当然在某些语言里称作方法,意义是相同的)都扮演着至关重要的角色。今天就来了解一下Python中的函数用法。一.函数的定义 在某些编程语言当中,函数声明和函数定义是区分开的(在这些编程语言当中函数声明
在windows下如何快速搭建web.py开发框架 用Python进行web开发的话有很多框架供选择,比如最出名的Django,tornado等,除了这些框架之外,有一个轻量级的框架使用起来也是非常方便和顺手,就是web.py。它由一名黑客所创建,但是不幸的是这位创建者于2013年自杀了。据说现在由
将Sublime Text 2搭建成一个好用的IDE 说起编辑器,可能大部分人要推荐的是Vim和Emacs,本人用过Vim,功能确实强大,但是不是很习惯,之前一直有朋友推荐SUblime Text 2这款编辑器,然后这段时间就试了一下,就深深地喜欢上这款编辑器了...
Python中的模块 有过C语言编程经验的朋友都知道在C语言中如果要引用sqrt这个函数,必须用语句&quot;#include&lt;math.h&gt;&quot;引入math.h这个头文件,否则是无法正常进行调用的。那么在Python中,如果要引用一些内置的函数,该怎么处理呢?在Python中
Python的基础语法 在对Python有了基础的认识之后,下面来了解一下Python的基础语法,看看它和C语言、java之间的基础语法差异。一.变量、表达式和语句 Python中的语句也称作命令,比如print &quot;hello python&quot;这就是一条语句。 表达式,顾名思义,是
Eclipse+PyDevʽjango+Mysql搭建Python web开发环境 Python的web框架有很多,目前主流的有Django、Tornado、Web.py等,最流行的要属Django了,也是被大家最看好的框架之一。下面就来讲讲如何搭建Django的开发环境。一.准备工作 需要下载的
在windows下安装配置Ulipad 今天推荐一款轻便的文本编辑器Ulipad,用来写一些小的Python脚本非常方便。 Ulipad下载地址: https://github.com/limodou/ulipad http://files.cnblogs.com/dolphin0520/u...
Python中的函数(三) 在前面两篇文章中已经探讨了函数的一些相关用法,下面一起来了解一下函数参数类型的问题。在C语言中,调用函数时必须依照函数定义时的参数个数以及类型来传递参数,否则将会发生错误,这个是严格进行规定的。然而在Python中函数参数定义和传递的方式相比而言就灵活多了。一.函数参数的
在Notepad++中搭配Python开发环境 Python在最近几年一度成为最流行的语言之一,不仅仅是因为它简洁明了,更在于它的功能之强大。它不仅能够完成一般脚本语言所能做的事情,还能很方便快捷地进行大规模的项目开发。在学习Python之前我们来看一下Python的历史由来,&quot;Pytho
Python中的条件选择和循环语句 同C语言、Java一样,Python中也存在条件选择和循环语句,其风格和C语言、java的很类似,但是在写法和用法上还是有一些区别。今天就让我们一起来了解一下。一.条件选择语句 Python中条件选择语句的关键字为:if 、elif 、else这三个。其基本形式如
关于raw_input( )和sys.stdin.readline( )的区别 之前一直认为用raw_input( )和sys.stdin.readline( )来获取输入的效果完全相同,但是最近在写程序时有类似这样一段代码:import sysline = sys.stdin.readline()
初识Python 跟学习所有的编程语言一样,首先得了解这门语言的编程风格和最基础的语法。下面就让我们一起来了解一下Python的编程风格。1.逻辑行与物理行 在Python中有逻辑行和物理行这个概念,物理行是指在编辑器中实际看到的一行,逻辑行是指一条Python语句。在Python中提倡一个物理行只
当我们的代码是有访问网络相关的操作时,比如http请求或者访问远程数据库,经常可能会发生一些错误,有些错误可能重新去发送请求就会成功,本文分析常见可能需要重试的场景,并最后给出python代码实现。
1.经典迭代器 2.将Sentence中的__iter__改成生成器函数 改成生成器后用法不变,但更加简洁。 3.惰性实现 当列表比较大,占内存较大时,我们可以采用惰性实现,每次只读取一个元素到内存。 或者使用更简洁的生成器表达式 4.yield from itertools模块含有大量生成器函数可
本文介绍简单介绍socket的常用函数,并以python-kafka中的源码socketpair为例,来讲解python socket的运用
python实践中经常出现编码相关的异常,大多网上找资料而没有理解原理,导致一次次重复错误。本文对常用Unicode、UTF-8、GB2312编码的原理进行介绍,接着介绍了python字符类型unicode和str以及常见编解码错误UnicodeEncodeError和UnicodeDEcodeEr