正则表达式
正则表达式,又称规则表达式(Regular Expression),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
语法
定义
正则表达式是一种字符串的匹配模式,用于检查给定的字符串是否含有某子串
普通字符
[ABC] 匹配[...]内的字符串
[^ABC] 匹配除了[...]内的字符串
[A-Z] []匹配所有的大写字母,[a-z]匹配小写
[a-b] 匹配字符a到字符b的所有字符
\w 匹配字母或数字或下划线或汉字
[\s] 匹配所有空白符
[\S] 匹配所有非空白符
非打印字符
\cx 匹配由x指明的控制字符
\f 匹配一个换页符。等价于 \x0c 和 \cL
\n 匹配一个换行符。等价于 \x0a 和 \cJ
\r 匹配一个回车符。等价于 \x0d 和 \cM
\t 匹配一个制表符。等价于 \x09 和 \cI
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]
元字符的概念以及反义字符
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
特殊字符
所谓特殊字符,就是一些有特殊含义的字符
$ 匹配字符串的结束
. 匹配除换行符以外的任意字符
* 匹配前面的字符串零次或多次
+ 匹配前面的字符串一次或多次
^ 匹配字符串的开始
? 匹配前面的自表达式零次或一次
[ 匹配标记一个中括号的开始
{ 标记限定符表达式的开始
() 标记一个子表达式的开始和结束位置
限定字符
限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
* 匹配前面的子表达式零次或多次
+ 匹配前面的子表达式一次或多次
? 匹配前面的零次或多次
{n} 匹配确定的n次
{n,} 至少匹配n次
{n,m} 最少匹配n次且至多匹配m次
修饰符
g 全局匹配某个字符串
i 忽略大小写匹配某个字符串
m 多行匹配
s 特殊字符圆点.中包含换行符 \n
本文由 Yuki 创作,采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
最后编辑时间为: Nov 30, 2020 at 05:15 pm