最近在和战队一起的比赛中又出现了诸多想要学习的知识点,那就是re和QRcode,今天先学一下这个正则吧。

那么我已开始接触正则呢,应该是在学爬虫的时候,因为当时爬虫学的不太好也就没有接着学正则匹配。后来在换了linux系统之后经常会用到一个很有用的东西,那就是|grep。不得不说这个在找东西的时候真的是很有用的,比如

1
$ls -l | grep ""

那么本次和Nepnep战队参加xctf分区赛也是有一道修复二维码的题目,当时师傅们可能有些点没注意到,导致最后修复的二维码多达16000的扫描结果。

得到结果之后本以为要经历漫长的人工过滤,可是咱们战队的一位爷爷直接solved,而这位爷爷就是直接用了正则匹配。

正则表达式

正则表达式(英语:Regular Expression,常简写为regex、regexp或RE),又称正则表示式、正则表示法、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。

以上来自维基百科。

转义符

右斜杠(\)老转义符了,在右斜杠之后的一个字将会带有特殊含义,如果要匹配右斜杠则需要双写。

通配符

通配符我们熟知的就是星号(*)和问号(?),一般情况下它们分别代表任意多个字符或者是任意一个字符,在正则表达式中存在三种类似的符号,并且不能匹配任意字符,只能代表前面一个字符的数量。

1
2
3
+:匹配一个或多个字符
?:匹配一个或零个字符
*:匹配零个或多个字符

例如

‘a+’可以匹配’a’,’aa’,’aaa’,’aaaa’……等字符串。

‘a?’可以匹配’a’或者空串

‘a*’则可以匹配第一种情况和第二种情况的并集。

匹配任意字符

[]方括号用于匹配单个字符。

例如

[abcde]可以匹配a,b,c,d,e中的任意一个字符。

如果加上^则代表匹配除了列表以外的所有字符。

例如

[^a]表示匹配所有非’a’的字符。

匹配次数限定

{}用于限定匹配次数

例如:

[ab]{3}表示[ab]匹配三次,[ab]{3,}表示至少匹配三次。

就先学这么多吧,后续再学就再加。