百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python自动化办公——提取图片上的文字(OCR)

off999 2024-12-03 17:15 23 浏览 0 评论

使用Python自动化办公时,当我们需要识别/提取别的软件上的文字信息时,可以使用OCR技术,即先截图,然后识别图片上的文字。

Python识别图片上文字的方式

1. 使用OCR技术:OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字转换为可编辑文本的技术。Python中有多个OCR库可供使用,如Tesseract、pytesseract、OCRopus等。

2. 使用深度学习模型:深度学习模型可以通过训练来识别图像中的文字。这种方式应用比较广泛,除了可以识别文字,还可以进行图像识别,比如人脸识别。

3. 使用传统的图像处理技术:传统的图像处理技术可以通过对图像进行预处理、分割、特征提取等步骤来识别图像中的文字。Python中有多个图像处理库可供使用,如OpenCV、Pillow等。

综上所述,识别文字,最合适的还是OCR技术,本节也只学习OCR技术。

Python识别图片上文字的方式

1. 使用Tesseract OCR引擎:Tesseract是一个开源的OCR引擎,由Google开发。Python中可以使用pytesseract库来调用Tesseract进行OCR识别。它的优点是识别准确率高,支持中英等多种语言。缺点是对于复杂的图像和文档格式支持不够好。我们就采用这种方式吧。

2. 使用OCRopus:OCRopus是一个基于Python的OCR框架,可以用于训练和识别OCR模型。它的优点是支持多种OCR技术和模型,可以自定义训练模型,且对于复杂的图像和文档格式支持较好。缺点是学习曲线较陡峭,需要一定的编程和机器学习知识。

3. 使用EasyOCR:EasyOCR是一个基于深度学习的OCR库,可以识别多种语言的文字。它的优点是识别准确率高,支持多种语言和字体。第一次使用时需下载他训练好的模型。

4. 使用百度/阿里等OCR API:这些云API功能强大,但需联网且不免费。

python使用Tesseract OCR

1、安装Tesseract OCR引擎

先到这里下载安装引擎:https://digi.bib.uni-mannheim.de/tesseract/


当前最新的是5.3.1,就选最新的这一条吧。


安装到这一步时注意,把下面两个展开,勾选中文数据,这样才能识别中文,如下图:



然后一路下一步,就完成啦!

然后还需要将其加入环境变量,默认安装路径为:C:\Program Files\Tesseract-OCR,加入到Path里面就可以了。

2、Python代码调用引擎的方式

pytesseract常用的有3个方法:

1. image_to_string函数:该函数可以对图片进行OCR识别,返回识别结果。函数的参数为加载的图片对象,可以指定识别语言、识别配置等参数。例如:

import pytesseract
from PIL import Image
# 加载图片
img = Image.open('test.png')
# 调用pytesseract库进行识别
text = pytesseract.image_to_string(img, lang='eng', config='--psm 6')
# 输出识别结果
print(text)

2. image_to_boxes函数:该函数可以对图片进行OCR识别,返回每个字符的位置和大小信息。例如:

import pytesseract
from PIL import Image
# 加载图片
img = Image.open('test.png')
# 调用pytesseract库进行识别
boxes = pytesseract.image_to_boxes(img, lang='eng')
# 输出每个字符的位置和大小信息
for b in boxes.splitlines():
b = b.split(' ')
print(b[0], b[1], b[3], b[4])

3. image_to_data函数:该函数可以对图片进行OCR识别,返回每个识别结果的详细信息,包括位置、大小、置信度等。例如:

import pytesseract
from PIL import Image
# 加载图片
img = Image.open('test.png')
# 调用pytesseract库进行识别
data = pytesseract.image_to_data(img, lang='eng', output_type=pytesseract.Output.DICT)
# 输出每个识别结果的详细信息
for i, text in enumerate(data['text']):
print(text, data['left'][i], data['top'][i], data['width'][i], data['height'][i], data['conf'][i])

3、测试

我准备了一些图片,来测试一下识别效果。

代码如下:

import pytesseract
from PIL import Image

img = Image.open('images/testocr_1.png')

text = pytesseract.image_to_string(img, lang='chi_sim')

print(text)

原图及识别结果如下:


这张图是我在百度上随便截取的一张图,可以看到识别的结果有一些错别字,但整体效果还可以。



这张是天天基金上的截图,大部分正确,也还行。



关于数字的识别基本正确。识别结果排版很乱,实际使用时,可以先将图片切割成一小块一小块,然后识别即可。



验证码的识别是有一定难度的,建议使用专业的工具。






百度图片上随便找了两个证件照,基本无法正确识别。还是得专业工具来。


这张图是我随便拍的一张照片,由于书并未放平,中间有一些凸出,导致识别结果不是很理想。如果放平效果应该会好一些。

总结

本次学习调研结束,Tesseract是基本可以满足自动化办公的需求。自动化办公中大多是屏幕上的截图,识别效果还是可以的。

相关推荐

u盘启动不了怎么回事(u盘启动也启动不了)

原因三:USB传输性能不佳导致;解决三:换个USB插口试试,建议将u盘插入到电脑机箱后置的USB插口处。原因四:u盘自身的质量问题导致;解决四:换一个u盘制作试一试。原因五:电脑系统问题导致;解决五:...

联想笔记本电脑键盘输入没反应

1.首先在可以进行输入的位置,长按下某个按键1秒以上,看看有没有反应。有反应看第2,没反应看第3。2.控制面板~轻松使用~轻松使用设置中心~更改键盘的工作方式~取消筛选键并应用即可。3.打开设备管理器...

软件管家电脑版下载官网(软件管家电脑版下载官网安装)

要下载和安装应用程序,您可以按照以下步骤使用电脑管家:1.打开电脑管家应用程序。2.在主界面上,您可以找到一个名为“应用中心”的选项,点击它。3.在应用中心中,您可以浏览各种应用程序的列表。您可...

台式电脑怎么取消定时关机(台式电脑设置自动关机怎么取消)

电脑设置了每天定时关机,取消的方法有多种,以下提供三种方式:方法一:打开任务计划程序(TaskScheduler)。找到“任务计划程序库”(TaskSchedulerLibrary),找到设置的...

win7怎么截屏快捷键(win7怎样截屏快捷键)

在Win7系统中,自带的截图快捷键是“PrtScn”键,即PrintScreen键。按下这个键后,系统会将当前屏幕的内容复制到剪贴板中,然后用户可以将其粘贴到其他应用程序中进行编辑或保存。此外,Wi...

如何查看笔记本配置(如何查看笔记本配置高低)

两种方法一种你在笔记本背面有个ID号,也就是序列号,你把它抄下来,输到笔记本品牌的官网上,查看他的配置就可以,这是第1种方法,第2种方法,你开机后,我的电脑上单击右键,点属性,就会在出来你的CPU内存...

linux软件(linux软件图标)

Linux是一种自由和开放源代码的类UNIX操作系统。该操作系统的内核由林纳斯·托瓦兹在1991年10月5日首次发布。在加上用户空间的应用程序之后,成为Linux操作系统。Linux也是自由软件和开放...

hp laserjet p1108打印机驱动

惠普LaserJetProP1108打印机安装打印机驱动的方法,可以通过以下步骤操作来实现:1、运行驱动安装包,在“HPLaserJetProP1100打印机系列”下,点击“USB安装...

台式机最好的配置(台式机最强配置)

家用台式电脑cpu一般选择英特尔8-10代的i3就能满足正常的家用,内存方面选择16g,绝对够用,再选择一块512g的固态硬盘,保证电脑的速度2022年台式电脑建议你可以配16gb或32gb的内存。硬...

笔记本电脑home键在哪(笔记本的home键怎么用)

home键位置一般有三个:一、键就在键盘最右边一列的上方,也是右上角处。二、在数字键盘的“7”键上,如果想使用"home"键功能,需要先关闭数字键功能。一般笔记本开、关数字键功能是按F...

win7汉化包下载(win7系统汉化)

要下载犀牛7grasshopper汉化包,首先你需要从官方网站或可靠的第三方网站上找到可信赖的下载链接。然后,点击链接进行下载,并确保你的电脑设备有足够的存储空间来安装这个汉化包。安装完成后,打开犀牛...

ghost系统备份与恢复的详细步骤

还原系统步骤。1、电脑开机进入ghost,这里注意如果是通过U盘启动盘进入,注意先进入bios把第一启动项设置为当前的U盘;如果是通过自身电脑硬盘启动,建议先把ghost系统安装好。2、点击确定,然后...

photoshop官方下载电脑版(ps软件官方下载中文版电脑版)

鼠标右键点击压缩包,点击解压到文件夹按钮。打开文件夹,点击安装文件。弹出安装对话框,点击默认位置。更改安装路径,点击确认按钮。等待安装完成,双击打开ps快捷方式即可。目前在电脑上免费下载PS是不太可能...

2025最火电脑壁纸(2025最火电脑壁纸全屏)

要更改MacBookPro2022的壁纸,可以按照以下步骤操作:首先,点击桌面上的空白区域,然后选择“更改桌面背景”选项。接着,从预设的壁纸中选择一个或者点击“+”号添加自己的图片。如果需要更改壁...

安装系统安装包(系统安装包里的安装文件在哪)

oppocoloros13具体的下载方法如下,第一步,手机打开OPPO官方网站服务中心,登录手机账号。第二步,找到coloroS13升级包,点击安全下载,将coloroS13系统升级软件包...

取消回复欢迎 发表评论: