当前位置：网站首页 > 技术资源 > 正文

在python中使用正则表达式及9个核心匹配函数用法示例

off999 2024-11-18 15:34 107 浏览 0 评论

基本功能：

2. compile

3. findall

4. finditer

5. match

6. search

7. fullmatch

8. 分割替换

9. 通用正则示例：

正则表达式的功能：

对字符有规律的查询和排除。
使用正则表达式时，都使用原生字符串表达，即用r 或 R 开头。

compile

功能：获取正则表达式对象

语法：compile( pattern , flags = 0 )

属性：

pattern：正则表达式
groupindex ：捕获组：（调用组）形成字典
groups：多个子组
flags可选：标志位：

I / IGNORECASE：忽略大小写
A / ASCII：对\w,\W,\b,\B,\d,\D,\s,\S,只进行ASCII匹配（python3.x版本)。
M / MULTILINE：将^ 和 $用于整个字符串开始和结尾的每一行（默认情况下，仅适用于整个字符串的开始和结尾处）。
S / DOTALL：使用 . 字符时匹配所有字符，包括换行符。
X / VERBOSE：忽略模式字符串中未转义的空格和注释。

示例：

import re
pattern = r'(?P<tpp>ab)cd(ef)(?P<app>dh)' # 正则表达式
obj = re.compile(pattern) # 获得一个正则对象
print('flags:',obj.flags) # 标志位
# flags: 32
print('pattern:',obj.pattern) # 正则表达式
# pattern: (?P<tpp>ab)cd(ef)(?P<app>dh)
print('groupindex:',obj.groupindex) # 捕获组以字典形式列出{组名：组序}
# groupindex: {'tpp': 1, 'app': 3}
print('groups:',obj.groups) # 子组个个数
# groups: 3

示例：

import re
pattern = r'ab' # 正则表达式
obj = re.compile(pattern) # 获得一个正则对象
l = obj.findall('abcdabcdabab') # 用这个对象的：findall的属性
# l = obj.findall('abcdabcdabab',6) # 这个对象的属性，开始参数
# l = obj.findall('abcdabcdabab',6,10) # 这个对象的属性，开始参数和结束参数
# l = re.findall(pattern,'abcdabcdabab') # 与re的findall结果一样，便参数不一样
print(l) # ['ab', 'ab', 'ab', 'ab']

findall

功能：通过正则表达式匹配字符串，以列表返回，没有返回：[ ]

语法：. findall ( string , pos , endpos )

string：目标字符串
pos：目标字符串匹配的开始位置
endpos：目标字符串匹配的结束位置

子组：如果正则表达式有子组，则只显示子组

示例：

import re
pattern = 'a(b.)+' # 正则表达式
obj = re.compile(pattern) # 用compile()获得对象
r = obj.findall('abcabcde') # 使用使用对象findall属性。
print(r) # ['bc', 'bc']
r = obj.findall('abcabcde',3) # 使用使用对象findall属性。
print(r) # ['bc']

示例：

import re
pattern = 'a.+' # 正则表达式
obj = re.compile(pattern) # 用compile()获得对象
r = obj.findall('abcabcde',3) # 使用使用对象findall属性。
print(r) # ['abcde']
r = obj.findall('abcabcde',3,5) # 使用使用对象findall属性。
print(r) # ['ab']

finditer

功能：使用正则表达式匹配目标内容，返回迭代 match 对象

语法：. finditer ( pattern , string ,flags = 0 )

pattern：模式字符串，由正则表达式转换而来
string：要匹配的字符串
flags：可选：标志位

示例：

import re
pattern = r'\d+' # 正则表达式:一个空格或多个。
obj = re.compile(pattern) # 获得一个正则对象
l = obj.finditer('2023年还有100天，你来10天啦吧')
print(l) # 返回一个迭代器：<callable_iterator object at 0x0000018BDED3CCD0>
for i in l: # 还是三个,match对象
print(i)
print('-'*30)
l = re.finditer(pattern,'2023年还有100天，你来10天啦吧')
for i in l: # 还是三个,match对象
print(i,i.group())
'''
<callable_iterator object at 0x000002B3DD88FE20>
<re.Match object; span=(0, 4), match='2023'>
<re.Match object; span=(7, 10), match='100'>
<re.Match object; span=(14, 16), match='10'>
------------------------------
<re.Match object; span=(0, 4), match='2023'> 2023
<re.Match object; span=(7, 10), match='100'> 100
<re.Match object; span=(14, 16), match='10'> 10
'''

match

功能：

匹配字符串开头，匹配返回 match 对象，否则 None
通常使用try处理异常

语法：. match ( pattern , string [ , flags ] )

pattern : 模式字符串，由正则表达式转换而来
string : 要匹配的字符串
flags : 可选：标志位，用于控制匹配方式：

I / IGNORECASE

功能：不区分大小写。

示例：

import re
pattern = r'p\w*' # 表达式
string = 'Python And Java' # 目标字符串
p = re.findall(pattern,string) # 正则匹配
print(p) # []
p = re.findall(pattern,string,re.I) # 正则匹配：忽略大小写
print(p) # ['Python']

M / MULTILINE

功能：行开头和结尾,将^ 和 $用于整个字符串开始和结尾的每一行（默认情况下，仅适用于整个字符串的开始和结尾处）。

示例：

import re
pattern = r'^python' # 表达式:^/$整个字符串的开头和结尾
string = '''python And Java
python id good
Python i love''' # 目标字符串
p = re.findall(pattern,string) # 正则匹配
print(p) # ['python']
p = re.findall(pattern,string,re.M) # 正则匹配:re.M:行开头
print(p) # ['python', 'python']
import re
pattern = r'java#39; # 表达式:^/$整个字符串的开头和结尾
string = '''python And java
python id java
Python and java''' # 目标字符串
p = re.findall(pattern,string) # 正则匹配
print(p) # ['java']
p = re.findall(pattern,string,re.M) # 正则匹配:re.M:行开头
print(p) # ['java', 'java', 'java']

S / DOTALL

功能：使用 . 字符时匹配所有字符，包括换行符。

示例：

import re
pattern = r'.+' # 表达式
string = '''python And java
python id java
Python and java''' # 目标字符串
p = re.findall(pattern,string) # 正则匹配
print(p) #
p = re.findall(pattern,string,re.S) # 正则匹配:re.S:跨行,用\n连接
print(p) #

X / VERBOSE

功能：忽略正则表达式中的注释和空格。

示例：

import re
pattern = r'''
(?P<app>py\w+) # 第一组
(.+) # 第二组
(?P<tpp>ja\w+) # 第三组
'''
string = 'python And java' # 目标字符串
p = re.findall(pattern, string,re.X) # 正则匹配：re.X忽略正则表达式中注释和空格
print(p) # [('python', ' And ', 'java')]

A / ASCII

对\w,\W,\b,\B,\d,\D,\s,\S,只进行ASCII匹配（python3.x版本)。
多个标志使用：re.I | re.X | re.S | re.M

示例：

import re
pattern = r'to' # 正则表达式
l = re.match(pattern,'to, too and toohe match')
print(l.group()) # to,匹配不到则出错
# 使用mompile对象方法
obj = re.compile(pattern) # 获得一个正则对象
l = obj.match('too and toohe match')
print(l.group()) # to,匹配不到则出错

search

功能：匹配一个字符串，返回mathc对象，否则None,只能匹配一处

语法：. search ( pattern , string )

pattern ：模式字符串，由正则表达式转换而来

string：目标字符串

示例：

import re
pattern = r'to' # 正则表达式
l = re.search(pattern,'to, too and toohe match')
print(l.group()) # to,匹配不到则出错
# 使用mompile对象方法
obj = re.compile(pattern) # 获得一个正则对象
l = obj.search('and toohe matoch')
print(l.group()) # to,只匹配一处

拓展:match对象属性

import re
pattern = r'(?P<dpp>ab)cd(?P<app>ef)' # 正则表达式
obj = re.compile(pattern) # 获得一个正则对象
ma_obj = obj.search('==abcdefghig==')
print(ma_obj.pos) # 目标字符串开始位置:0
print(ma_obj.endpos) # 目标字符串结束位置:14
print(ma_obj.re) # re.compile('(?P<dpp>ab)cd(?P<app>ef)')
print(ma_obj.regs) # ((2, 8), (2, 4), (6, 8))
print(ma_obj.string) # 目标字符串：==abcdefghig==
print(ma_obj.lastgroup) # 最后一组的名字：app
print(ma_obj.lastindex) # 最后是第几组：2
print(ma_obj.start()) # 匹配到内容的开始位置：2
print(ma_obj.end()) # 匹配到内容的结束位置：8
print(ma_obj.span()) # 匹配到内容的起止位置：(2, 8)
print(ma_obj.group()) # 获取到匹配的全部内容：abcdef，默认为0，省略
print(ma_obj.group(1)) # 获取到匹配的第1组的内容：ab，超出报错
print(ma_obj.group(2)) # 获取到匹配的第2组的内容：ef，超出报错
print(ma_obj.groups()) # 获取所有子组的内容：('ab', 'ef')
print(ma_obj.groupdict()) # 获取捕获组内容：{'dpp': 'ab', 'app': 'ef'}
# print(ma_obj.expand()) #

fullmatch

功能：完全匹配

语法：. fullmatch ( pattern ,strint )

pattern ：模式字符串，由正则表达式转换而来

string：目标字符串

示例：

import re
pattern = r'to.*' # 正则表达式
l = re.fullmatch(pattern,'to and toohe matoch')
print(l.group()) # to,不能完全匹配则出错
try:
l = re.fullmatch(pattern,'to \n and toohe matoch')
print(l.group())
except AttributeError as e:
print(e) # 'NoneType' object has no attribute 'group'

分割替换

split

功能：根据正则表达式切割目标字符串

语法：. split( string )

string：目标字符串

示例：

import re
pattern = r'\s+' # 正则表达式:一个空格或多个。
obj = re.compile(pattern) # 获得一个正则对象
# l = obj.split('python and java or c++')
l = re.split(pattern,'python and java or c++')
print(l) # ['python', 'and', 'java', 'or', 'c++']

sub

功能：替换正则表达式匹配到的内容

语法：. sub( replaceStr , string ,max )

replaceStr：要替换的内容

string：目标字符串

max：最多替换几处

示例：

import re
pattern = r'\s+' # 正则表达式:一个空格或多个。
obj = re.compile(pattern) # 获得一个正则对象
l = obj.sub(' +/+ ','python and java or c++',3)
l = re.sub(pattern,' +/+ ','python and java or c++',3)
print(l) # python +/+ and +/+ java +/+ or c++

subn

功能：替换正则表达匹配的内容，及替换个数

语法：. subn ( repl , string , count )

repl ：要替换的内容

string：目标字符串

count：最多替换几处

示例：

import re
pattern = r'\s+' # 正则表达式:一个空格或多个。
obj = re.compile(pattern) # 获得一个正则对象
l = obj.subn(' +/+ ','python and java or c++',2)
print(l) # ('python +/+ and +/+ java or c++', 2)
l = re.subn(pattern,' +/+ ','python and java or c++')
print(l) # ('python +/+ and +/+ java +/+ or +/+ c++', 4)

通用正则

示例：

中文字符：[\u4e00-\u9fa5]
双字节字符：[^\x00-\xff]
邮箱地址：\w[-\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\.)+[A-Za-z]{2,14}
网络地址：^((https|http|ftp|rtsp|mms)?:\/\/)[^\s]+
国内手机：0?(13|14|15|17|18|19)[0-9]{9}
国内座机：[0-9-()（）]{7,18}
负浮点数：-([1-9]\d*.\d*|0.\d*[1-9]\d*)
正浮点数：[1-9]\d*.\d*|0.\d*[1-9]\d*
腾讯QQ：[1-9]([0-9]{5,11})
IP地址：(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)
身份证号：\d{17}[\d|x]|\d{15}
日期格式：\d{4}(\-|\/|.)\d{1,2}\1\d{1,2}
用户名称：[A-Za-z0-9_\-\u4e00-\u9fa5]+

导图总结：私信：【正则全图】可获得高清全图

python表达式

上一篇：python正则表达式
下一篇：Python基础 8 基本术语—运算符和表达式

在python中使用正则表达式及9个核心匹配函数用法示例

基本功能：

2. compile

3. findall

4. finditer

5. match

6. search

7. fullmatch

8. 分割替换

9. 通用正则示例：

compile

findall

finditer

match

search

fullmatch

分割替换

split

sub

subn

通用正则

导图总结：私信：【正则全图】可获得高清全图

相关推荐

取消回复欢迎你发表评论:

抖音上好看的小姐姐，Python给你都下载了

飞牛NAS部署TVGate Docker项目，实现内网一键转发、代理、jx

全网最简单易懂!495页Python漫画教程，高清PDF版免费下载

win7系统还原步骤图解（win7还原电脑系统的步骤）

Python 3.14 的 UUIDv6/v7/v8 上新，别再用 uuid4 () 啦!

网盘在哪里打开（华为网盘在哪里打开）

python入门到脱坑输入与输出—str()函数

linux软件（linux软件图标）

16949认证费用是多少（16949审核员太难考了）

苹果手机怎么下载软件并安装

在python中使用正则表达式及9个核心匹配函数用法示例

基本功能：

2. compile

3. findall

4. finditer

5. match

6. search

7. fullmatch

8. 分割替换

9. 通用正则示例：

compile

findall

finditer

match

search

fullmatch

分割替换

split

sub

subn

通用正则

导图总结：私信：【正则全图】可获得高清全图

相关推荐

取消回复欢迎 你 发表评论:

抖音上好看的小姐姐，Python给你都下载了

飞牛NAS部署TVGate Docker项目，实现内网一键转发、代理、jx

全网最简单易懂!495页Python漫画教程，高清PDF版免费下载

win7系统还原步骤图解（win7还原电脑系统的步骤）

Python 3.14 的 UUIDv6/v7/v8 上新，别再用 uuid4 () 啦!

网盘在哪里打开（华为网盘在哪里打开）

python入门到脱坑 输入与输出—str()函数

linux软件（linux软件图标）

16949认证费用是多少（16949审核员太难考了）

苹果手机怎么下载软件并安装

取消回复欢迎你发表评论:

python入门到脱坑输入与输出—str()函数