Python中使用正则表达式的环视功能


什么是环视

环视只是进行子表达式的匹配,并不占字符,匹配到的内容不保存,因此也叫做零宽断言,环视最终的匹配结果就是一个位置。

环视按照方向可以分为顺序环视和逆序环视两种,按是否进行匹配分为肯定和否定两种,组合起来就是四种模式。

环视表达式 解释
(?=expression) 顺序肯定环视,表示所在位置右侧能匹配expression
(?!rexpression) 顺序否定环视,表示所在位置右侧不匹配expression
(?<=expression) 逆序肯定环视,表示所在位置左侧能匹配expression
(?<!expression) 逆序否定环视,表示所在位置左侧不匹配expression

只说概念可能有些抽象,分别举例子来演示一下具体的使用场景。

一些示例

  1. 顺序肯定环视
1
2
3
4
# s = 'xiaomi9iphone8iphone7',需要在每个手机型号后面加上逗号,变成 s= 'xiaomi9,iphone8,iphone7'
import re
print(re.sub(r'(?=iphone)',',',s))
# 顺序肯定环视,所确定的位置右边是字符串iPhone,在此位置即可添加逗号
  1. 逆序肯定环视
1
2
3
4
5
6
# s = 'Takes Reservations:No Delivery:No Take-out:Yes Accepts Credit Cards:Yes Good for Groups:No'
# 需求是要在Yes,和No的后面加上逗号,使之变成
# s = 'Takes Reservations:No, Delivery:No, Take-out:Yes, Accepts Credit Cards:Yes, Good for Groups:No'
import re
re.sub(r"(?<=(No))(?=(\s+))|(?<=(Yes))(?=(\s+))",',',s)
# 逆序肯定环视,所要确定的位左边必须能匹配上No,或者Yes
  1. 顺序否定环视
1
2
3
4
# s = '123aaa',将s字符串变成 s='123,a,a,a,'
# 分析一下,就是在字符串右侧非数字的位置,添加逗号,即使用顺序否定环视,匹配右侧非数字位置
s = '123aaa'
re.sub(r'(?!\d+)',',',s)
  1. 逆序否定环视
1
2
3
4
# 将 s= 'aaa123'变成 s=  ',a,a,a,123'
# 分析一下,就是在非数字左侧的位置加逗号,使用逆序否定环视,匹配左侧非数字的位置
s= 'aaa123'
re.sub(r'(?<!\d)',',',b)

有些例子不是很合理,尽量能表达清楚环视的含义即可。

总结:

1
环视的功能非常强大,也是正则中的一个难点,对于环视的理解,可以从应用和原理两个角度理解,如果想理解得更清晰、深入一些,还是从原理的角度理解好一些,正则匹配基本原理参考 NFA引擎匹配原理

-------------The End-------------

本文标题:Python中使用正则表达式的环视功能

文章作者:cloud sjhan

发布时间:2019年08月16日 - 13:08

最后更新:2019年08月16日 - 13:08

原始链接:https://cloudsjhan.github.io/2019/08/16/Python中使用正则表达式的环视功能/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

cloud sjhan wechat
subscribe to my blog by scanning my public wechat account
坚持原创技术分享,您的支持将鼓励我继续创作!
0%
;