百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

利用CnOCR实现自动对截屏图片OCR

off999 2024-12-03 17:15 21 浏览 0 评论

cnocr的介绍可见:

更好用的开源Python OCR工具包:CnOCR V2.2


自动对截屏图片进行文字识别(OCR)

我自己有对截屏图片进行文字识别的需求,比如遇到某些网站不让拷贝,或者识别分享视频中的某个文字信息等。之前我都是用QQ自带的截屏识别功能来完成整个操作的,但是流程比较麻烦。


为什么不装一个对应的app?大部分免费的app后面其实都是调用的大公司的AI平台的接口,还得去折腾平台app key,怪麻烦的而且还无法离线使用。要么就是限制调用次数。当然,另一个原因是我一直期望用自己开发的 cnocr 来完成这个功能,eat your own dog food 嘛,自己不用的东西肯定没前途。


之前考虑过搞个浏览器插件或者做个系统应用来完成这个功能,但我对系统应用开发一窍不通而且前端技术也只了解基础的html和css,所以还是放弃了。欢迎大家朝着这个方向做些工作。


现在的实现方法很简单,各个系统(Windows、Mac、Linux)的截屏应用有很多很好用的,基本都有把截屏图片存储在指定位置这个功能。基于这个功能,我只要搞个守护进程轮询去查看是否有刚更新的图片,如果有就把它拿给cnocr识别下,然后把识别的结果复制进系统的剪切板即可。


怎么搭起来这个功能呢?开始之前先确保你的 cnocr v2.2版已经安装成功,否则请参考 安装文档 搞定cnocr最新版的安装。


以下是具体的搭建流程:

1. 找一个用得惯的截屏软件,这个软件只要支持把截屏图片存储在指定位置即可。比如Mac下我用的是免费的 Xnip

2. 除了安装cnocr v2.2外,这里面需要额外安装一个python包 pyperclip,利用它把ocr结果复制进系统的剪切板:

> pip install pyperclip

3. 拷贝下面的代码,存储到新文件 screenshot_daemon.py 。编辑此文件 "SCREENSHOT_DIR" 所在行,把路径改为你的截屏图片所存储的目录。

# coding: utf-8
# Copyright (C) 2022, [Breezedeus](https://github.com/breezedeus).

import os
import time
import glob
from pprint import pformat

import pyperclip as pc
from cnocr import CnOcr
from cnocr.utils import set_logger

logger = set_logger(log_level='DEBUG')


SCREENSHOT_DIR = os.getenv(
    "SCREENSHOT_DIR", '<你的截屏图片存储目录>'  # ==> 换成你的目录
)
OCR_MODEL = CnOcr()


def get_newest_fp_time(screenshot_dir):
    fn_list = glob.glob1(screenshot_dir, '*g')
    fp_list = [os.path.join(screenshot_dir, fn) for fn in fn_list]
    if not fp_list:
        return None, None
    fp_list.sort(key=lambda fp: os.path.getmtime(fp), reverse=True)
    return fp_list[0], os.path.getmtime(fp_list[0])


def ocr_newest(screenshot_dir, delta_interval):
    while True:
        newest_fp, newest_mod_time = get_newest_fp_time(screenshot_dir)
        if (
            newest_mod_time is not None
            and time.time() - newest_mod_time < delta_interval
        ):
            logger.info(f'analyzing screenshot file {newest_fp}')
            result = OCR_MODEL.ocr(newest_fp)
            texts = [_one['text'] for _one in result]
            logger.info(f'\tOCR results: {pformat(texts)}\n\n')
            if texts:
                pc.copy('\n'.join(texts))
        time.sleep(1)


if __name__ == '__main__':
    ocr_newest(SCREENSHOT_DIR, 2)

4. 运行此脚本文件,all done:

> python screenshot_daemon.py


接下来就是享受随时ocr的乐趣了:


欢迎大家尝试,遇到问题可以评论,感谢。


知识星球私享群

此文初始发表于 知识星球CnOCR/CnSTD私享群 (
https://wx.zsxq.com/dweb2/index/group/28858522821151)
知识星球私享群会陆续发布一些CnOCR/CnSTD相关的私有资料,包括更详细的训练教程各种资源福利,使用过程中遇到的疑难解答等。本群也会发布OCR/STD相关的最新研究资料。欢迎感兴趣的朋友加入。

相关推荐

登录126邮箱入口(登录126邮箱入口官网)

126邮箱是网易的一个免费邮箱登录入口在浏览器输入:mail.126.com浏览器进入126邮箱网站之后,即可自行登录126邮箱账号。如何在手机上登录126邮箱1、打开手机,找到并打开网易邮箱软件。2...

如何让防火墙允许某个软件(如何允许防火墙阻止访问)

1.打开电脑的开始菜单,找到控制面板选项,并点击打开。2.在打开的控制面板中,找到防火墙选项,并点击打开。3.在打开的防火墙界面中,单击左侧的允许程序通过防火墙选项。4.在跳转的界面中,选择允许通过防...

智慧工厂管理系统(智慧工厂管理系统哪家好)
智慧工厂管理系统(智慧工厂管理系统哪家好)

智慧工厂智能化系统整体的解决方案分为三个主要部分,分别是现场控制系统(FDC)、生产数据管理系统(PDM)以及工厂数字化协同平台(LCT)。其中,现场控制系统(FDC)是智慧工厂系统非常重要的核心组成部分,它是一个支持大规模互联的集群控制系...

2025-11-13 22:03 off999

笔记本无法连接此网络(笔记本无法连接网络wifi)
  • 笔记本无法连接此网络(笔记本无法连接网络wifi)
  • 笔记本无法连接此网络(笔记本无法连接网络wifi)
  • 笔记本无法连接此网络(笔记本无法连接网络wifi)
  • 笔记本无法连接此网络(笔记本无法连接网络wifi)
电脑如何打开隐藏文件(电脑怎么打开隐藏文件夹)

要显示隐藏文件,首先需要打开文件资源管理器,然后点击菜单栏中的“查看”选项,选中“隐藏项目”复选框即可。此时,隐藏文件和文件夹将会显示在文件资源管理器中,可以进行正常操作。如果需要隐藏文件和文件夹,可...

华硕官网客服电话(华硕官网400客服电话)

华硕维修中心官网,http://www.asus.com.cn/support/你可以通过电话,邮件等方式联系华硕的售后客户,提供你的主板序列号,他会告诉你的。华硕ROG真享服务包是一项专门针对购买华...

win11如何进入安全模式(win11如何进入安全模式启动)

进入Win11安全模式有多种方法,下面介绍两种常用的方法:方法一:使用系统配置工具1.使用组合键Win+R打开“运行”对话框,输入“msconfig”并按Enter键。2.在“系统配...

网易邮箱163登录界面(网易163邮箱登陆界面)

163邮箱登录首页入口为http://mail.163.com/网易163免费邮箱--中文邮箱第一品牌.容量自动翻倍,支持50兆附件,免费开通手机号码邮箱赠送3G超大附件服务.支持各种客户端软件收发,...

win10激活注意事项(win10激活过程要多久)

1.是:KMS激活、数字许可证激活、产品密钥激活。2.KMS激活是通过KeyManagementService服务器来激活系统,它需要连接到企业内部的KMS服务器进行激活,适用于企业用户。数字...

华硕官网正品查询(华硕官网防伪查询)

登陆网站www.asus.com.cn进入网站,点击防伪查询,输入16位防伪数码,即可辨别真伪。华硕显卡sn码官网查1.打开浏览器进入华硕官方网站。2.在页面下方找到“华硕产品服务政策”类目,点击进入...

数据网络打开了连不上网怎么回事

1、如您无法上网请尝试关机开机重启;请检查是否已达本月流量封顶阀值;请检查手机设置移动数据是否已打开;手机设置流动数据选项APN及名称是否设置为3gnet。2、如仍无法上网,建议您可通过以下方式进行排...

synopsys软件(synthia软件)

PSIM是趋向于电力电子领域以及电机控制领域的仿真应用包软件。PSIM具有仿真高速、用户界面友好、波形解析等功能,为电力电子电路的解析、控制系统设计、电机驱动研究等有效提供强有力的仿真环境。本...

cmd定时关机命令设置时间(cmd定时关机怎么设置)

在WindowsXP下打开C盘,在Windows下选system32中有一个shutdown的程序,可以复制到其它系统中。“开始”--->运行--->(在输入shutdown的命令)...

笔记本电脑开机就蓝屏(笔记本电脑开机就蓝屏了)

USB:  假如计算机处于开机的状态时USB接口上有U盘等存储设备,那么计算机就很有可能出现蓝屏现象,而且无法正常开机。因此,当计算机在开机时出现蓝屏状态时,我们首先要检查一下USB接口是否有接入U...

重置无线路由器(重置无线路由器密码)

1、将网线—路由器—电脑之间的线路连接好,启动电脑和路由器设备;2、启动设备后,打开浏览器,在地址栏中输入192.168.1.1进入无线路由器设置界面。(如进不了请翻看路由器底部铭牌或者是路由器使用说...

取消回复欢迎 发表评论: