Python正则表达式的使用技巧
off999 2025-05-24 16:02 23 浏览 0 评论
1. 介绍
1.1 介绍
福哥今天要给大家讲讲Python的正则表达式的使用技巧,正则表达式(Regular expressions)就是通过一系列的特殊格式的匹配符号去描述一个字符串的工具。
使用正则表达式可以快速检测字符串的格式,也可以从字符串里面查找出符合特定规则的字符串片断,还可以将字符串按照特定的规则替换或者重组成新的字符串。
2. 正则表达式
2.1 表达式
2.1.1 re.compile
使用re.compile方法可以定义一个pattern,用来使用其他方法调用这个pattern。
url = "https://tongfu.net/home/35.html"
pattern = re.compile(r"tongfu\.net", re.I)
print(re.findall(pattern, url))2.1.2 re.template
re.template方法和re.compile方法类似,可以达到相同的目的。
url = "https://tongfu.net/home/35.html"
pattern = re.template(r"tongfu\.net", re.I)
print(re.findall(pattern, url))2.2 匹配
2.2.1 re.match
re.match可以实现使用pattern去匹配字符串,结果是一个对象,可以有很多功能可以使用。
re.match是从字符串开头进行匹配的,pattern如果不包含字符串开头部分的话,匹配一定会失败!
url = "https://tongfu.net/home/35.html"
match = re.match(r"https\:\/\/([^\/]+)\/home\/(\d+)\.html", url)
print(match.group())
print(match.groups())2.2.2 re.search
re.search和re.match类型,区别在于re.search不是从字符串开头匹配的。
如果我们的pattern本身就是从字符串开头匹配的话建议使用re.match,因为效率它更快!
url = "https://tongfu.net/home/35.html"
match = re.search(r"home\/(\d+)\.html", url)
print(match.group())
print(match.groups())2.2.3 re.findall
re.findall可以直接返回一个tuple数组,而且可以实现多组匹配。
urls = "https://tongfu.net/home/35.html," \
"https://tongfu.net/home/8.html"
matches = re.findall(r"https\:\/\/([^\/]+)\/home\/(\d+)\.html", urls)
print(matches)2.3 替换
2.3.1 re.sub
使用re.sub可以将pattern匹配的字符串片断替换为我们想要的内容,这里面还可以将pattern中的匹配组应用到替换内容里面。
urls = "https://tongfu.net/home/35.html," \
"https://tongfu.net/home/8.html"
matches = re.sub(r"\/home\/(\d+)\.html", r"/homepage/\1.htm", urls)
print(matches)2.3.2 re.subn
re.subn和re.sub在字符串替换功能上面没有区别,re.subn比re.sub多了一个替换次数的统计,这个会在返回值里面体现出来。
urls = "https://tongfu.net/home/35.html," \
"https://tongfu.net/home/8.html"
matches = re.subn(r"\/home\/(\d+)\.html", r"/homepage/\1.htm", urls)
print(matches)2.4 修饰符
修饰符就是参数flags,用来对pattern进行一个补充。
修饰符 | 描述 |
|---|---|
re.I | 忽略大小写敏感,就是不管大小写问题,字母对就算匹配了。 |
re.L | 本地化识别匹配。 |
re.M | 多行匹配,默认正则表达式会在遇到换行符后结束匹配,设置这个之后就会一直匹配到末尾。 |
re.S | 使字符“.”匹配换行符,默认字符“.”是不包括换行符的。 |
re.U | 使用Unicode解析字符串,它会影响“\w”,“\W”,“\b”,“\B”的作用。 |
re.X | 这个福哥还没有研究过,官方说法就是可以让编写pattern更加简单。 |
3. 总结
今天福哥带着童鞋们学习了Python的正则表达式库re的使用技巧,正则表达式在各种语言的编程时候都是非常重要的库,使用正则表达式可以让我们处理字符串变得更加简单、更加优雅~~
https://m.tongfu.net/home/35/blog/513407.html
相关推荐
- 无线网有个红叉(无线网有个红叉,搜索不到网络)
-
连接失败,路由坏换路由,外网坏,报修无线网络处出现红叉表示设备无法正常工作。请检查网卡驱动是否正常,无线网络开关是否打开。解决方法:查看电脑是否有无线网络开关,且是否打开。进入设备管理器检查网卡驱动是...
- thinkpad笔记本官网首页(thinkpad官方商城)
-
官方网站 国内:http://www.thinkworld.com.cn 国内用户只需要访问国内即可。 ThinkPad,中文名为“思考本”,在2005年以前是IBMPC事业部旗下的便携式计算机...
- win7什么版本最好用(win7哪个版本最稳定流畅)
-
Windows7旗舰版,最好,最稳定。Windows7,是由微软公司(Microsoft)开发的操作系统,内核版本号为WindowsNT6.1。Windows7可供选择的版本有:简易版(Sta...
- win7自带虚拟光驱怎么使用(win7系统虚拟光驱安装教程)
-
以DAEMONTools为例,360软件管家里面就有最新版的下.安装后使用方法如下:第一种方法:在虚拟光驱界面中,你先按一下中间工具栏最左边“+”符号的按钮,添加镜像文件(可以一次添加多个),这...
- 电脑装系统蓝屏(电脑装系统蓝屏重启开不了机)
-
蓝屏的原因往往集中在不兼容的硬件和驱动程序、有问题的软件、病毒等。解决办法:1、病毒的原因。使用电脑管家杀毒。2、内存的原因。用橡皮擦把内存条的金手指擦拭一下,把氧化层擦掉,确保内存条安装、运行正常。...
- u盘安装软件(u盘安装软件到电视)
-
第一种情况:软件安装包可以直接下载的。在电脑上将软件安装包下载到本地硬盘,然后将下载好软件安装包拷贝到U盘上即可拿到别的电脑上去安装。分可为exe格式的和rar格式,exe格式直接安装,rar格式的解...
- microsoft官网账户注册(microsoft 帐户注册)
-
要创建Microsoft账户,您可以按照以下步骤进行操作:1.打开任意一个支持浏览器的设备,如电脑、手机或平板电脑。2.在浏览器中输入"Microsoft账户注册"或直接访问Mic...
- 显示器闪屏是什么原因(显示器闪屏是哪里坏了)
-
解决方法: 一、接触不良导致的显示器闪屏 先查看主机和显示器的电源线连接,是否松动,重新插拔一下电源线。 二、信号干扰导致的显示器闪屏 1、连接显示器的电缆线是否没有屏蔽线圈,如果没有防干扰的...
- 国产linux操作系统(国产linux操作系统有什么版本)
-
中国对于操作系统的探索其实并不晚。 早在20世纪60年代中期中国就开始操作系统的研发,那时的比尔·盖茨还只是个迷恋计算机的小字辈,南京大学教授孙钟秀、北京大学杨芙清院士等都是我国操作系统的拓荒者...
- 免费无需排队的云电脑(不需要排队的云电脑)
-
目前市场上有一些云游戏平台提供无限时长且无需排队的服务。这些平台通常采用先进的云计算技术和高性能服务器,能够提供稳定流畅的游戏体验。用户可以随时登录并畅玩游戏,无需等待排队。这些平台还提供多种游戏选择...
- wps官方下载(wps官方下载官网电脑版网址)
-
具体的步骤如下:1、首先在电脑上打开浏览器,在浏览器中输入“WPS”,找到WPS官方网站。2、接下来进入WPS官方网站中,找到WPS软件,点击“免费下载”。3、点击下载后在弹出来的对话框中修改下载位置...
- win vista与win7有什么区别(win7与vista关系)
-
WindowsVista和Windows7是微软公司推出的两个桌面操作系统,它们之间有以下主要区别:1.界面设计:Windows7的界面设计更加简洁明了,而WindowsVista的界面...
- winxp系统版本(winxp 版本)
-
1、微软官方3个版本:WINDOWSXPHOME(家庭版)、Professional(专业版)、MediaCenter2005(媒体中心版),每个版本的功能不一样。使用最多的是Professional...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
