linux统计txt文件中单词出现次数并排序
文件:a.txt任务:统计该文件中每一个单词出现的次数,并按照出现频率从大到小排序sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr解析:sed替换sed 's/被替换的字符串/新字符串/[替换选项]' filename替换选项g表示替换文本中所有出现被替换字符串之处uniq统计次数uniq -c表示打印每...
·
文件:a.txt
任务:统计该文件中每一个单词出现的次数,并按照出现频率从大到小排序
sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr
解析:
sed替换
sed 's/被替换的字符串/新字符串/[替换选项]' filename
替换选项g表示替换文本中所有出现被替换字符串之处
uniq统计次数
uniq -c表示打印每行在文本中重复出现的次数
sort排序
-n根据数字大小进行排序
-r将排序结果逆向显示
增强版:
sed -e 's/\?//g' -e 's/ /\n/g' "test.txt" | sort | uniq -c | sort -nr
test.txt文件为:hello mylove i love you how about you do you love me?
当sed包含多个命令时,需要用-e分隔开来,第一个表示过滤掉文件中的"?"再进行计算。
输出结果为:
3 you
2 love
1 mylove
1 me
1 i
1 how
1 hello
1 do
1 about
更多推荐
已为社区贡献1条内容
所有评论(0)