正则表达式

当前位置:正则表达式 > python

python正则表达式元字符

import re

print('------------------匹配单个字符与数字------------')

r'''

1:'.' :匹配除换行符以外的任意字符

    print(re.search('.','www.baidu.com')) #匹配的是w

2:[0123456789]:[]是字符集合,表示匹配方括号中所包含的任意一个字符

    print(re.search([0123456789],'www.baidu.com.8')) #匹配的是w

3:[sunck]:匹配方括号中所包含的任意一个字符,则其匹配s,u,n,c,k字符串

    print(re.search([sunck],'sunck.baidu.com.8')) #匹配的是s

4:[a-z]:表示匹配任意的小写字母

5:[A-Z]:表示匹配任意的大写字母

6:[0-9]:匹配任意数字,类似[0123456789]

7:[0-9a-zA-Z]:匹配任意的数字和字母

8:[0-9a-zA-Z_]:匹配任意的数字,字母和下划线

9:[^sunck]:匹配除了sunck这几个字母以为的所有字符,即不包括s,u,n,c,k的字符

    []里的'^'称为脱字符,表示不匹配集合中的字符

10:[^0-9]:匹配所有的非数字字符

11:\d:匹配所有的数字字符,效果同[0-9],有^时要加上[]

12:\D:匹配非数字字符,效果同[^0-9]

13:\w:匹配数字,字母和下划线,效果同[0-9a-zA-Z_]

14:\W:匹配非数字,字母和下划线,效果同[^0-9a-zA-Z_]

15:\s:匹配任意的空白符(空格,换行,会车,换页,制表),效果同[ \f\n\r\t]

16:\S:匹配任意的非空白符(空格,换行,会车,换页,制表),效果同[^ \f\n\r\t]

'''

print('---------------锚字符(边界字符)---------')

'''

1:^:行首匹配,,以xx开头,和在[]里的不一样

2:$:行尾匹配,以xx结尾

    print('^sunck$','sunck is goods man')#返回None,找不到以sunck开头并结果的字符串

3:\A:匹配字符串开始(行首匹配),它和^的区别是,

    \A:只匹配整个字符串的开头,即使在re.M模式下也不会匹配它的行首

    ;^只要是行首就匹配

4:\Z:匹配字符串结束,它和$的区别是,

    \Z:只匹配整个字符串的结尾,即使在re.M模式下也不会匹配它的结尾

    ;$只要是行尾就匹配

5:\b:匹配一个单词的边界(要加r防止转义),也就是指单词和空格间的位置,'er\b'可以匹配never,不能匹配nerve

6:\B:匹配非单词的边界,也就是指单词和空格间的位置,可以匹配nerve,不能匹配never

    print(re.search(r'er\b','never'))

    print(re.search(r'er\b','nerve'))

    print(re.search(r'er\B','never'))

    print(re.search(r'er\B','nerve'))

'''

print('----------------------匹配多个字符---------------')

'''

说明:下方的x,y,z均为假设的普通字符,m,n为非负整数,不是正则表达式的元字符

1:(xyz):匹配小括号内的xyz(作为一个整体取匹配)

    print(re.search(r'(sunck)','sunck is good man'))

2:x?:匹配0个或者1个x #非贪婪匹配

    print(re.findall(r'a?','aaa'))#匹配3个a,即返回列表中的3个元素都是a

3:x*:匹配0个或者任意多个x #贪婪匹配

    print(re.findall(r'a*','aaa'))#匹配aaa

4:x+:匹配至少一个x #贪婪匹配

5:x{n(n}:匹配确定的n个x

6:x{n,}:匹配至少n个x

7:x{n,m}:匹配至少n个最多m个x。注意n<=m

8:x|y:|表示或,匹配的x或y

'''

print('‘---------------------特殊--------------')

'''

1:*? +?x? 最小匹配 (通常都是尽可能多的匹配)可以使用这种方式解决贪婪匹配

2:(?:x)  类似于(xyz)但不表示一个组

'''

'''

#需求:提取sunck·····man

str='sunck is a good man! sunck is a nice man! sunck is a very handsome man'

print(re.findall(r'^sunck.*man$',str))


相关文章
苏ICP备2022026517号-2  |   苏公网安备 32081202000316号
淮安先皓网络科技有限公司 © 版权所有  联系我们