分隔字符串分三种情况,一种是分隔符是空格,一种是非空格,还有一种是多个字符作为分隔符

先来创建一个文件吧:

Nam Chinese Math English

Tom 80 90 100

Jack 83 88 90

Lilei 84 80 88

注意:这个文件是用空格分隔的,所以字段之间的空格数目不一样

我们想要查看每个人的English成绩,则可以用

awk '{print $1 "\t" $4}' student.txt

7194e5244af2823a70c452fe07ba6a77.png

可以看到,最后全部列出了所有人的English成绩,由此可见,在使用空格分隔是,连续的空格会当做一个分隔符来处理,那么对于别的分隔符呢?我们来看看

首先来看看指定分隔符的用法:

将文件修改成用:分隔

Nam:Chinese:Math:English

Tom:80:90:100

Jack:83:88:90

Lilei:84:80:88

然后执行

awk -F ':' '{print $1"\t"$4}' student.txt

66f295b68790d31a18e5e1c7c5994519.png

可见,和上面输出是一样的,所以可以通过 -F来指定分隔符,除此之外,FS也可以指定分隔

awk '{FS=":"} {print $1 "\t" $4}' student.txt输出结果:

e7931a92e050db65a79fc2ca505ed546.png

成绩是输出了,但是名字好像没有被分隔,事实上,awk的用法是 awk '条件1{动作1} 条件2{动作2}'  文件名,但是在执行这些动作的时候已经把行读取了,所以应该在读取之前就指定分隔符,所以用BEGIN

awk 'BEGIN {FS=":"} {print $1 "\t" $4}' student.txt

489c44b3bdc7fb2a3cd8e9c2d8fb8155.png

最后结果也一样,所以说在指定分隔符的时候可以用-F也可以用FS,需要注意的是用FS时要加上BEGIN。好了,回到前面,当有多个非空格分隔符呢?来试试,把文件修改成如下:

Nam::Chinese::Math::English

Tom::80::90::100

Jack::83::88::90

Lilei::84::80::88

然后执行

awk -F ':' '{print $1 "\t" $4}' student.txt

f24cd42fe4622bd7e2abe1d850d4f6ee.png

可以看到,并没有输出我们想要的结果!

那就是试试::

awk -F '::' '{print $1 "\t" $4}' student.txt

95a098bd5a63111760f841a5bdb6a97a.png

这次得到了想要的输出,由此可见,在只用空格作为分隔符是,中间的多个空格都会当做一个分隔来处理,当使用别的空格符是,指定几个分隔符就按几个来分隔。

所以这里我们可以使用简单的正则来处理:

正则中 * 表示前面的字符出现任意次(包含0),所以在有多个分隔符时我们可以用*开匹配:

awk -F ':*' '{print $1 "\t" $4}' student.txt这就是说分隔符是 : 或是 :: 或是 ::: 或是::::等等

f901dcb2aba4455e619418a206cc7df0.png

最后得到了正确的输出

既然可以用正则,那就可以使用多个不同的分隔符,将文件改成如下:

Nam:/Chinese:;Math<>>>>English

Tom/80/90::100

Jack/83/88<>90

Lilei::84::80<<<88

然后执行

awk -F '[:/;<>]*' '{print $1 "\t" $4}' student.txt

41b8c26e04564ecf38398469e0c444cd.png

好吧,很黄很暴力,但结果确实是正确的!

除此之外,awk还可以用substr来截取字符串,如下截取日期:

#!/usr/bin/bash

date=`date +%Y%m%d`

year=`echo $date | awk '{print substr($date, 0, 4)}'`

month=`echo $date | awk '{print substr($0, 5, 2)}'`

day=`echo $date | awk '{print substr($date, 7, 2)} '`

echo $date

echo $year

echo $month

echo $day

这里有用到了两个函数,date和awk substr,date用来获取日期,其余的用法还有

获取明天的日期

date -d next-day +%Y%m%d

获取昨天的日期

date -d last-day +%Y%m%d

获取上个月的年和月

date -d last-month +%Y%m

获取下个月的年和月

date -d next-month +%Y%m

获取明年的年份

date -d next-year +%Y

在获取非当前日期时需要加上-d参数,另外还可以指定时分秒

比如:echo `date +%Y%m%d-%H:%M:%S`,在格式化日期的时候只有月和日是小写,其余都是大写。

awk中常用的函数:

cc57627397bcb31d27fe4a0b52b2cb68.png

版权声明:本文为博主原创文章,未经博主允许不得转载。

Logo

更多推荐