Python正则表达式之一：基础

前一阵，QA提了一个需求，我一看此需求用正则表达式最合适不过。考虑到之前每次使用正则表达式，都是临时抱佛脚，于是这次我就一遍完成任务一遍系统的学习了一遍正则表达式。主要参考PyCon2016上的一个视频 Regular Expressions 。我将分几篇文章对正则表达式进行总结。以下是第一部分，基础：

基础部分

这里总结了正则表达式最基础的用法，其中大部分内容对我（以及大部分程序员）来说都是平时经常用到的，所以我就一笔带过了，只对其中的几处用例子说明。

. 除了换行之外的其他所有字符

^ 行首

$ 行尾

[abcd] abcd其中的一个字符 [^abcd] 除了abcd之外的任意字符 [a-d] 相当于[abcd] [a-dz] 相当于[abcdz]

\b 单词边界

\w 字母数字或下划线相当于[a-zA-Z0-9_]

\W 与\w相反

\d 数字，相当于[0-9]

\D 与\d相反

\s 空白字符，相当于[ \t\n\r\f\v]

\S 与\s相反

{5} 在此之前的正则表达式部分（下同）准确的出现5次

{2,5} ~出现2到5次

{2,} ~出现2次或多次

{,5} ~出现0到5次

* ~出现0次或多次

？ ~出现0次或1次

+ ~出现1次或多次

ABC|DEF 匹配ABC或者DEF

\ 转义字符，如\ 表示匹配*，\$表示匹配$*

\b、 \用以下几个例子简单说明一下：

\b：

>>> re.search(r'\bhello\b', 'hello') <_sre.SRE_Match object; span=(0, 5), match='hello'> >>> re.search(r'\bhello\b', 'hello world') <_sre.SRE_Match object; span=(0, 5), match='hello'> >>> re.search(r'\bhello\b', 'hello,world') <_sre.SRE_Match object; span=(0, 5), match='hello'> >>> re.search(r'\bhello\b', 'hello_world') >>>

其实这里，\b大体上和\W一支，但是\b可以匹配行首行尾等非显示类的字符，而\W不可以。

>>> re.search(r'\$100', '$100') <_sre.SRE_Match object; span=(0, 4), match='$100'> >>> re.search(r'$100', '$100') >>>

想要匹配那些在正则表达式中有特殊含义的字符，如$、^、*等，就需要用\进行转义。

raw string:

另外，前面例子中，模式字符串（pattern）前面都加了一个r，这个r的意思是raw string，后面所接的字符串，Pyhton解释器无需对其进行转义。因为，\在python字符串中和正则表达式中都有特殊含义，所以如果不是raw string，那么要表达一个\字符，就需要四个\了（在Python解释器中先转义一次，2个\表示1个\，剩下2个\，在正则表达式中又转义一次，最终剩下一个\）。例如：

>>> re.search(r'\bhello\b', 'hello') <_sre.SRE_Match object; span=(0, 5), match='hello'> >>> re.search('\bhello\b', 'hello') >>> re.search('\\bhello\\b', 'hello') <_sre.SRE_Match object; span=(0, 5), match='hello'> >>> re.search('\\\\hello\\\\', '\\hello\\') <_sre.SRE_Match object; span=(0, 7), match='\\hello\\'> >>> re.search(r'\\hello\\', '\\hello\\') <_sre.SRE_Match object; span=(0, 7), match='\\hello\\'> >>> print('\\hello\\') \hello\

有了这些知识，正则表达式的基本运用就没什么问题了。对于一些特殊情况，还需要掌握另外一些高级用法，敬请期待后续文章。

转载请注明出处： http://blog.guoyb.com/2017/02/27/python-regex/ 。

欢迎使用微信扫描下方二维码，关注我的微信公众号TechTalking，技术生活思考：

Python正则表达式之一：基础

Trending Articles

出售: police 旅行喼

立法院三讀《海洋基本法》訂6/8國家海洋日一年內須提白皮書

Sienna空車價

首相署：大马在与中国的合作关系中寻求“高度有利的条件”

Vivaldi 韋瓦第瀏覽器 7.4.3684.43 免安裝中文版 (7.5.3735.56 安裝版) - Opera創辦人所出品的類Chrome瀏覽器

[DBD-Raws][机动战士高达0079剧场版三部曲合集/Mobile Suit Gundam The Movie...

【报Bug】AMap com.amap.api:3dmap：请考虑将 SDK 升级到版本 10.0.600。

升级beta3，卡在KextLog: collection UUID matches with loaded kcs

慧荣SM3259AB主控量产求助

出售:SoTM sMS-200 Ultra Neo

「妳的名號──我的道路」－　望廈聖方濟各堂教友玫瑰聖母月退省

請教SRAM系統年份

母女檔聯手詐騙半年得款三千萬

免费翻墙节点大全

「青春達人」性別平等教育講座

cocos creator 3.5.2 與 Android Studio 3.5.2 打包 aab 一直上不了 Google Play store

大規模詐騙新聞網站攻擊活動BaitTrap鎖定50個國家而來，目的是進行網路投資詐欺

【百年真相】中共第一次换妻潮及相关命案

Android Kotlin使用Mockito进行单元测试

cocos creator 是否可以使用 lottie？