Python项目实战篇,常用验证码标注和识别(需求分析和实现思路)
off999 2024-10-23 12:51 31 浏览 0 评论
来源:Python爬虫与数据挖掘
作者:Python进阶者
一、前言
今天给大家分享的实战项目是常用验证码标注&识别,从想法诞生到实现思路,再到编码实战的整体过程,这个过程我前后整理了上万字,计划分章节来发布。言归正传,一起来看看今天的内容吧!今天这篇内容主要讲解这篇文章的创作灵感、需求分析和实现思路。
首先介绍一下验证码基本概念,验证码全称为全自动区分计算机和人类的图灵测试(Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA),俗称验证码,是一种区分用户是计算机和人的公共全自动程序。验证码的主要目的是强制人机交互来抵御机器自动化攻击,为了确保服务器系统的稳定和用户信息的安全,大部分网站采用了验证码技术。图片验证码是目前最常用的一种,本文也主要讨论这种验证码的识别。
最初,图片验证码识别的想法最初源于12年的大学阶段,当时的学校教务系统每次抢课系统就崩溃,而且还要特定时间段跟其他同学一起抢指定课程,基本抢不到自己想修的课程,那时候就想绕过系统图片验证码通过代码实现自动抢课,鉴于当时自己编码能力和技术能力有限,机器学习、神经网络相关框架效果较差,最后以各种条件限制实现不了告终~~
XDM,等等,故事还没完,时间回到2021年,做为一名勤于搬砖、善于思考学习的程序猿,在经过几年社会的毒打后,想着以现在自己的项目经验、学习能力和编码功底,以及行业内机器学习、神经网络等AI技术的发展,能不能把多年以来的想法给实现,达到图片验证码高正确率识别预测,训练一个高度可用的CNN模型。在做项目之前经过笔者几天的资料查询过程中,确信高可用的验证码识别模型想法是可以做的,于是开启了CNN神经网络等技术前置知识的漫长学习过程。
几个月过后,项目编码实战出炉,效果嘛,自我感觉还行,基本达到高可用,500张训练数据图,CNN模型单个字符97%以上准确率。
这里先贴项目的工程Git地址,有基础的同学可以去直接拉取项目下来把玩源码:
[Java后台-通用验证码标注系统](https://gitee.com/snowball2dev/DataMarkService)
[Vue管理后台模板-通用验证码标注系统](https://gitee.com/snowball2dev/DataMarkService-Vue)
[Python-图片验证码识别模型案例](https://gitee.com/snowball2dev/VerifyCodeRecognize-Python)
[标注系统线上效果体验地址](http://139.9.191.103:8084/)好的,XDM,如果到这里还有兴趣往下看的话,那么就请跟随结合笔者的学习、编码实战过程来了解常用的验证码识别方法和过程。
二、需求分析
说到图片验证码识别功能,这个功能初步想想也简单,网上搜一下关键词,相关文章和开源项目非常多。以下是github搜索结果:
乍一看,好像真有免费的午餐,随便下载个CNN-python项目,改几行代码,然后开始疯狂标注数据过程,就能跑出来模型。
笔者自己最初也是这么想的,只求简单粗暴,于是弄了几个项目下来跑了之后,发现代码是可以用,但是效果非常拉跨,单个字符识别正确率很低,70%不到,4-6个字符那正确率就更低了,基本上达不到高正确率,可用性非常一般。对于一个有追求的程序猿,不可能这么就完事了,于是,这就有了这个项目的整活。
在使用这些开源项目的过程中,发现下载的项目实现过程大都分为2种思路,第一种无需图片切割,直接数据标注训练模型;第二种为图片验证码进行字符切割,然后为单个字符进行分类训练。项目执行的具体过程就不演示了,有兴趣的读者开源自行捣鼓,下面就是笔者自己对2种思路适用方式的实践思考总结:
1. 第一种无需图片切割
优点:简单粗暴,通用性强,直接用各种卷积神经网络模型硬怼图片验证码提取特征,适合知道验证码生成的正向代码过程,用代码生成图片验证码数据给模型训练。
缺点:数据量小时模型拟合效果差,需要大量人工标注数据,不太适合不知道验证码生成规则,少量标注数据。
2. 第二种进行字符切割
针对验证码生成规则,分析验证码各种背景干扰、噪声点像素、字体形变和累叠、字符位置随机及个数不定、反色等情况,对图片逆向处理,达到局部字符可切割,降低卷积模型层次,降低数据标注量,实现字符分类。
优点:可针对单一图片验证码做特殊预处理,可实现部分字符切割,针对字符小图进行分类训练,小批量数据标注就可以训练模型达到高拟合效果,达到可用
缺点:通用性不强,训练模型只适用特定图片验证码,复杂验证码可能无法切割XDM,等等,还有一种思路:
笔者自己学习OpenCV时想到的,通过图片预处理,轮廓检测,然后对A-Z,0-9字符通过SIFT算法进行特征提取,最后跟需要匹配的字符进行FLANN匹配,理想很丰满,然后编写相关代码后发现由于验证码的正向生成过程导致字符特征变化太大,并不适合,于是放弃采用该思路,代码见上述代码链接中的python项目image_match.py。
根据以上思路总结,根本没有免费的午餐,好的数据和特征工程同等重要,要实现好的效果,都是要根据具体问题具体分析,所以笔者分析自己的图片验证码识别案例,更适合第二种,另外一点原因大批量标注数据人工成本过高,个人不太喜欢。以下将附带案例详细介绍第二种识别思路的实现过程。
三、实现思路
根据需求初步分析,大概可分为四个步骤:
1. 数据采集/预处理:http批量下载,OpenCV API使用学习,图片预处理
2. 数据标注:GUI标注功能开发,人工标注数据阶段,模型训练后预测数据可进行数据集补充
3. CNN神经网络模型训练:windows环境,cpu/gpu,学习神经网络框架API,微积分、线代、概率论等前置知识,加深对神经网络模型理解,pytroch框架的使用
4. 项目部署:linux环境下,标注系统VUE前端部署、标注系统Java后端部署、Python模型部署
以下是Xmind脑图导出效果:
四、总结
我是Snowball。这篇内容主要讲解了常用验证码标注&识别的背景知识, 介绍了验证码的基本概念,讲述了这个文章的的创作灵感、需求分析和实现思路。
相关推荐
- 电脑如何打开隐藏文件(电脑怎么打开隐藏文件夹)
-
要显示隐藏文件,首先需要打开文件资源管理器,然后点击菜单栏中的“查看”选项,选中“隐藏项目”复选框即可。此时,隐藏文件和文件夹将会显示在文件资源管理器中,可以进行正常操作。如果需要隐藏文件和文件夹,可...
- 华硕官网客服电话(华硕官网400客服电话)
-
华硕维修中心官网,http://www.asus.com.cn/support/你可以通过电话,邮件等方式联系华硕的售后客户,提供你的主板序列号,他会告诉你的。华硕ROG真享服务包是一项专门针对购买华...
- win11如何进入安全模式(win11如何进入安全模式启动)
-
进入Win11安全模式有多种方法,下面介绍两种常用的方法:方法一:使用系统配置工具1.使用组合键Win+R打开“运行”对话框,输入“msconfig”并按Enter键。2.在“系统配...
- 网易邮箱163登录界面(网易163邮箱登陆界面)
-
163邮箱登录首页入口为http://mail.163.com/网易163免费邮箱--中文邮箱第一品牌.容量自动翻倍,支持50兆附件,免费开通手机号码邮箱赠送3G超大附件服务.支持各种客户端软件收发,...
- win10激活注意事项(win10激活过程要多久)
-
1.是:KMS激活、数字许可证激活、产品密钥激活。2.KMS激活是通过KeyManagementService服务器来激活系统,它需要连接到企业内部的KMS服务器进行激活,适用于企业用户。数字...
- 华硕官网正品查询(华硕官网防伪查询)
-
登陆网站www.asus.com.cn进入网站,点击防伪查询,输入16位防伪数码,即可辨别真伪。华硕显卡sn码官网查1.打开浏览器进入华硕官方网站。2.在页面下方找到“华硕产品服务政策”类目,点击进入...
- 数据网络打开了连不上网怎么回事
-
1、如您无法上网请尝试关机开机重启;请检查是否已达本月流量封顶阀值;请检查手机设置移动数据是否已打开;手机设置流动数据选项APN及名称是否设置为3gnet。2、如仍无法上网,建议您可通过以下方式进行排...
- synopsys软件(synthia软件)
-
PSIM是趋向于电力电子领域以及电机控制领域的仿真应用包软件。PSIM具有仿真高速、用户界面友好、波形解析等功能,为电力电子电路的解析、控制系统设计、电机驱动研究等有效提供强有力的仿真环境。本...
- cmd定时关机命令设置时间(cmd定时关机怎么设置)
-
在WindowsXP下打开C盘,在Windows下选system32中有一个shutdown的程序,可以复制到其它系统中。“开始”--->运行--->(在输入shutdown的命令)...
- 笔记本电脑开机就蓝屏(笔记本电脑开机就蓝屏了)
-
USB: 假如计算机处于开机的状态时USB接口上有U盘等存储设备,那么计算机就很有可能出现蓝屏现象,而且无法正常开机。因此,当计算机在开机时出现蓝屏状态时,我们首先要检查一下USB接口是否有接入U...
- 重置无线路由器(重置无线路由器密码)
-
1、将网线—路由器—电脑之间的线路连接好,启动电脑和路由器设备;2、启动设备后,打开浏览器,在地址栏中输入192.168.1.1进入无线路由器设置界面。(如进不了请翻看路由器底部铭牌或者是路由器使用说...
- win7系统整个界面变大(win7系统整个界面变大怎么办)
-
解决方法:1、首先查看当前系统的桌面图标情况,发现桌面图标突然变成了超大号的了。非常难看。2、右键点击桌面空白处,分别选择“查看”,“中等图标”。3、现在再查看桌面图标,发现已经恢复了。4、还有一种方...
- 电脑设置一切正常就是没声音
-
在电脑重置后没有声音的情况下,可能有以下几种可能的原因和解决方法:1.音频驱动程序问题:电脑重置后,可能需要重新安装或更新音频驱动程序。你可以尝试重新安装声卡驱动程序,可以从电脑或声卡制造商的官方网...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
