利用CnOCR实现自动对截屏图片OCR
off999 2024-12-03 17:15 27 浏览 0 评论
cnocr的介绍可见:
更好用的开源Python OCR工具包:CnOCR V2.2
自动对截屏图片进行文字识别(OCR)
我自己有对截屏图片进行文字识别的需求,比如遇到某些网站不让拷贝,或者识别分享视频中的某个文字信息等。之前我都是用QQ自带的截屏识别功能来完成整个操作的,但是流程比较麻烦。
为什么不装一个对应的app?大部分免费的app后面其实都是调用的大公司的AI平台的接口,还得去折腾平台app key,怪麻烦的而且还无法离线使用。要么就是限制调用次数。当然,另一个原因是我一直期望用自己开发的 cnocr 来完成这个功能,eat your own dog food 嘛,自己不用的东西肯定没前途。
之前考虑过搞个浏览器插件或者做个系统应用来完成这个功能,但我对系统应用开发一窍不通而且前端技术也只了解基础的html和css,所以还是放弃了。欢迎大家朝着这个方向做些工作。
现在的实现方法很简单,各个系统(Windows、Mac、Linux)的截屏应用有很多很好用的,基本都有把截屏图片存储在指定位置这个功能。基于这个功能,我只要搞个守护进程轮询去查看是否有刚更新的图片,如果有就把它拿给cnocr识别下,然后把识别的结果复制进系统的剪切板即可。
怎么搭起来这个功能呢?开始之前先确保你的 cnocr v2.2版已经安装成功,否则请参考 安装文档 搞定cnocr最新版的安装。
以下是具体的搭建流程:
1. 找一个用得惯的截屏软件,这个软件只要支持把截屏图片存储在指定位置即可。比如Mac下我用的是免费的 Xnip 。
2. 除了安装cnocr v2.2外,这里面需要额外安装一个python包 pyperclip,利用它把ocr结果复制进系统的剪切板:
> pip install pyperclip
3. 拷贝下面的代码,存储到新文件 screenshot_daemon.py 。编辑此文件 "SCREENSHOT_DIR" 所在行,把路径改为你的截屏图片所存储的目录。
# coding: utf-8
# Copyright (C) 2022, [Breezedeus](https://github.com/breezedeus).
import os
import time
import glob
from pprint import pformat
import pyperclip as pc
from cnocr import CnOcr
from cnocr.utils import set_logger
logger = set_logger(log_level='DEBUG')
SCREENSHOT_DIR = os.getenv(
"SCREENSHOT_DIR", '<你的截屏图片存储目录>' # ==> 换成你的目录
)
OCR_MODEL = CnOcr()
def get_newest_fp_time(screenshot_dir):
fn_list = glob.glob1(screenshot_dir, '*g')
fp_list = [os.path.join(screenshot_dir, fn) for fn in fn_list]
if not fp_list:
return None, None
fp_list.sort(key=lambda fp: os.path.getmtime(fp), reverse=True)
return fp_list[0], os.path.getmtime(fp_list[0])
def ocr_newest(screenshot_dir, delta_interval):
while True:
newest_fp, newest_mod_time = get_newest_fp_time(screenshot_dir)
if (
newest_mod_time is not None
and time.time() - newest_mod_time < delta_interval
):
logger.info(f'analyzing screenshot file {newest_fp}')
result = OCR_MODEL.ocr(newest_fp)
texts = [_one['text'] for _one in result]
logger.info(f'\tOCR results: {pformat(texts)}\n\n')
if texts:
pc.copy('\n'.join(texts))
time.sleep(1)
if __name__ == '__main__':
ocr_newest(SCREENSHOT_DIR, 2)4. 运行此脚本文件,all done:
> python screenshot_daemon.py
接下来就是享受随时ocr的乐趣了:
欢迎大家尝试,遇到问题可以评论,感谢。
知识星球私享群
此文初始发表于 知识星球CnOCR/CnSTD私享群 (
https://wx.zsxq.com/dweb2/index/group/28858522821151) 。知识星球私享群会陆续发布一些CnOCR/CnSTD相关的私有资料,包括更详细的训练教程,各种资源福利,使用过程中遇到的疑难解答等。本群也会发布OCR/STD相关的最新研究资料。欢迎感兴趣的朋友加入。
相关推荐
- u盘启动不了怎么回事(u盘启动也启动不了)
-
原因三:USB传输性能不佳导致;解决三:换个USB插口试试,建议将u盘插入到电脑机箱后置的USB插口处。原因四:u盘自身的质量问题导致;解决四:换一个u盘制作试一试。原因五:电脑系统问题导致;解决五:...
- 联想笔记本电脑键盘输入没反应
-
1.首先在可以进行输入的位置,长按下某个按键1秒以上,看看有没有反应。有反应看第2,没反应看第3。2.控制面板~轻松使用~轻松使用设置中心~更改键盘的工作方式~取消筛选键并应用即可。3.打开设备管理器...
- 软件管家电脑版下载官网(软件管家电脑版下载官网安装)
-
要下载和安装应用程序,您可以按照以下步骤使用电脑管家:1.打开电脑管家应用程序。2.在主界面上,您可以找到一个名为“应用中心”的选项,点击它。3.在应用中心中,您可以浏览各种应用程序的列表。您可...
- 台式电脑怎么取消定时关机(台式电脑设置自动关机怎么取消)
-
电脑设置了每天定时关机,取消的方法有多种,以下提供三种方式:方法一:打开任务计划程序(TaskScheduler)。找到“任务计划程序库”(TaskSchedulerLibrary),找到设置的...
- win7怎么截屏快捷键(win7怎样截屏快捷键)
-
在Win7系统中,自带的截图快捷键是“PrtScn”键,即PrintScreen键。按下这个键后,系统会将当前屏幕的内容复制到剪贴板中,然后用户可以将其粘贴到其他应用程序中进行编辑或保存。此外,Wi...
- 如何查看笔记本配置(如何查看笔记本配置高低)
-
两种方法一种你在笔记本背面有个ID号,也就是序列号,你把它抄下来,输到笔记本品牌的官网上,查看他的配置就可以,这是第1种方法,第2种方法,你开机后,我的电脑上单击右键,点属性,就会在出来你的CPU内存...
- linux软件(linux软件图标)
-
Linux是一种自由和开放源代码的类UNIX操作系统。该操作系统的内核由林纳斯·托瓦兹在1991年10月5日首次发布。在加上用户空间的应用程序之后,成为Linux操作系统。Linux也是自由软件和开放...
- hp laserjet p1108打印机驱动
-
惠普LaserJetProP1108打印机安装打印机驱动的方法,可以通过以下步骤操作来实现:1、运行驱动安装包,在“HPLaserJetProP1100打印机系列”下,点击“USB安装...
- 台式机最好的配置(台式机最强配置)
-
家用台式电脑cpu一般选择英特尔8-10代的i3就能满足正常的家用,内存方面选择16g,绝对够用,再选择一块512g的固态硬盘,保证电脑的速度2022年台式电脑建议你可以配16gb或32gb的内存。硬...
- 笔记本电脑home键在哪(笔记本的home键怎么用)
-
home键位置一般有三个:一、键就在键盘最右边一列的上方,也是右上角处。二、在数字键盘的“7”键上,如果想使用"home"键功能,需要先关闭数字键功能。一般笔记本开、关数字键功能是按F...
- win7汉化包下载(win7系统汉化)
-
要下载犀牛7grasshopper汉化包,首先你需要从官方网站或可靠的第三方网站上找到可信赖的下载链接。然后,点击链接进行下载,并确保你的电脑设备有足够的存储空间来安装这个汉化包。安装完成后,打开犀牛...
- ghost系统备份与恢复的详细步骤
-
还原系统步骤。1、电脑开机进入ghost,这里注意如果是通过U盘启动盘进入,注意先进入bios把第一启动项设置为当前的U盘;如果是通过自身电脑硬盘启动,建议先把ghost系统安装好。2、点击确定,然后...
- photoshop官方下载电脑版(ps软件官方下载中文版电脑版)
-
鼠标右键点击压缩包,点击解压到文件夹按钮。打开文件夹,点击安装文件。弹出安装对话框,点击默认位置。更改安装路径,点击确认按钮。等待安装完成,双击打开ps快捷方式即可。目前在电脑上免费下载PS是不太可能...
- 2025最火电脑壁纸(2025最火电脑壁纸全屏)
-
要更改MacBookPro2022的壁纸,可以按照以下步骤操作:首先,点击桌面上的空白区域,然后选择“更改桌面背景”选项。接着,从预设的壁纸中选择一个或者点击“+”号添加自己的图片。如果需要更改壁...
- 安装系统安装包(系统安装包里的安装文件在哪)
-
oppocoloros13具体的下载方法如下,第一步,手机打开OPPO官方网站服务中心,登录手机账号。第二步,找到coloroS13升级包,点击安全下载,将coloroS13系统升级软件包...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
