元字符只有在英文状态下输入,才具有解释力,如果要检索元字符本身,可以用转义符“\”再加元字符。下面是用来检索中文的常用正则表达式。
正则表达式 语法说明
传媒 表示“传媒”。单个字符串检索,可以直接输入字符串进行检索。
因为.{1,10}所以 表示“因为”与“所以”之间相隔1-10个字符,可以采用此方法进行多个字符串组合检索。
人{1,2} 表示“人”和“人人”。
虽然|尽管 表示“虽然”或者“尽管”。
(与其|宁可).{1,15}(不如|也不) 表示“与其”或者“不如”,并且它们的后边1-15个字符后出现“不如”或者“也不”。
\(.*\) 表示检索两边是英文括号,中间是任何字符,可以把英文括号换成其它符号进行类似的检索。
好[^的]{3} 表示“好”,并且“好”后面3个字符范围内不含有“的”字。
听.*?得 表示“听”字,并且在“听”后最短的距离之内出现了“得”字。
(?<=一).{1} “?<=”表示检索的是“一”后面的任意一个字符。“?<=”表示检索条件,“.{1}”表示匹配除换行符以外的任意一个字符。比如“一个”就符合该正则表达式,其中“一”是检索条件,“个”是检索到的内容。可以用这个方法检索量词。
.{1}(?=得) “?=”表示检索的是“得”前面的任意一个字符。“?=”表示检索条件,“.{1}”表示匹配除换行符以外的任意一个字符。比如“打得、笑得、哭得”就符合该正则表达式,其中“得”是检索条件,“打、笑、哭”是检索到的内容。
附:常用的正则表达式元字符及其所代表的含意
元字符 语法说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
& 匹配字符串的结束
\w 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符