grep是用linux中用来进行文本搜索的工具,它使用的是正则表达式进行搜索。

grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

grep的表达式有

^  #锚定行的开始 如:'^grep'匹配所有以grep开头的行。

$  #锚定行的结束 如:'grep$'匹配所有以grep结尾的行。

.  #匹配一个非换行符的字符 如:'gr.p'匹配gr后接一个任意字符,然后是p。

*  #匹配零个或多个先前字符 如:'*grep'匹配所有一个或多个空格后紧跟grep的行。

.*   #一起用代表任意字符。

[]   #匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。

[^]  #匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行。

\(..\)  #标记匹配字符,如'\(love\)',love被标记为1。

\

\>      #锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。

x\{m\}  #重复字符x,m次,如:'0\{5\}'匹配包含5个o的行。

x\{m,\}  #重复字符x,至少m次,如:'o\{5,\}'匹配至少有5个o的行。

x\{m,n\}  #重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个o的行。

\w    #匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。

\W    #\w的反置形式,匹配一个或多个非单词字符,如点号句号等。

\b    #单词锁定符,如: '\bgrep\b'只匹配grep。

grep也支持POXIS字符

[:alnum:]    #文字数字字符

[:alpha:]    #文字字符

[:digit:]    #数字字符

[:graph:]    #非空字符(非空格、控制字符)

[:lower:]    #小写字符

[:cntrl:]    #控制字符

[:print:]    #非空字符(包括空格)

[:punct:]    #标点符号

[:space:]    #所有空白字符(新行,空格,制表符)

[:upper:]    #大写字符

[:xdigit:]   #十六进制数字(0-9,a-f,A-F)

例子1 -c表示比配的行数

cat test.txt | grep aa -c

1

例子2 -n显示行号

cat test.txt | grep -n e

5:eeffgghh

例子3 直接搜索文件的内容

grep ff test.txt

eeffgghh

例子4 找出某个字符开头结尾的内容

zimingdeMacBook-Air:test ziming$ grep ^ee test.txt

eeffgghh

zimingdeMacBook-Air:test ziming$ grep ^[^ee] test.txt

aa

ss

iijjkkkllm

12345789

zimingdeMacBook-Air:test ziming$ grep hh$ test.txt

eeffgghh

例子5 找出或关系的多个关键字

grep -E 'hh|ss' test.txt

ss

eeffgghh

例子6 找出至少七个字母的内容

grep '[a-z]\{7\}' *.txt

eeffgghh

iijjkkkllm

参考文档:

Logo

更多推荐