linux 多个文件内容查找,Linux 根据一个文件内容查找另一个文件中的内容

有文本1.txt，内容如下：{"phone":"18633333333","code":"333333"}{"phone":"18611111111","code":"111111"}{"phone":"18655555555","code":"555555"}{"phone":"18644444444","code":"444444"}{"phone":"18622222222","code":

weixin_39662955

4515人浏览 · 2021-04-28 16:15:33

weixin_39662955 · 2021-04-28 16:15:33 发布

有文本1.txt，内容如下：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

{"phone":"18644444444","code":"444444"}

{"phone":"18622222222","code":"222222"}

有文本2.txt，内容如下：

18600000000

18633333333

18699999999

18611111111

18655555555

需求

找出1.txt中的phone字段是否在2.txt中，若存在，则输出完整的json串。

解决

方法一

遍历2.txt，逐行去1.txt中grep，输出到3.txt。

cat 2.txt | while read line

grep $line 1.txt >> 3.txt

done

3.txt中内容：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

方法二(推荐)

由于博主之前清洗数据时两个文件都200多兆，使用while read line循环读取非常耗时。

使用awk合并两个文件

以:作为分隔符

逐行扫描，当ARGIND是文件1取分隔后的第四个元素作为key，整个一行原始字符串作为value，加入到awk数组(也可理解为map集合)

逐行扫描，当ARGIND是文件2时判断第一个元素是否存在数组中(awk判断的是key是否存在)

awk -F'"' '{if(ARGIND==1)phones[$4]=$0}{if(ARGIND>1 && ($1 in phones))print phones[$1]}' 1.txt 2.txt

输出：

{"phone":"18633333333","code":"333333"}

{"phone":"18611111111","code":"111111"}

{"phone":"18655555555","code":"555555"}

特别注意

需关注两个文件的文件格式，必须一致，否则会出现问题。

建议都转为unix编码格式。

Linux

更多推荐

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏