Linux命令总结之tr命令

转载地址，做了部分补充。谢谢原作者。什么是tr命令？tr,translate的简写，translate的翻译：[trænsˈleit]vi. 翻译, 能被译出vt. 翻译, 解释, 转化, 转变为, 调动在这里用到的意思是转化，转变,转换，在linux下输入tr --help查看一下提示：1234567...

Leo606

4495人浏览 · 2018-08-17 10:42:10

Leo606 · 2018-08-17 10:42:10 发布

转载地址，做了部分补充。谢谢原作者。

什么是tr命令？tr,translate的简写，translate的翻译：

[trænsˈleit]

vi. 翻译, 能被译出

vt. 翻译, 解释, 转化, 转变为, 调动

在这里用到的意思是转化，转变,转换，在linux下输入tr --help查看一下提示：

amosli@amosli-pc:~$ tr --help

Usage: tr [OPTION]... SET1 [SET2]

Translate, squeeze, and/or delete characters from standard input,

writing to standard output.

-c, -C, --complement use the complement of SET1

-d, --delete delete characters in SET1, do not translate

-s, --squeeze-repeats replace each input sequence of a repeated character

that is listed in SET1 with a single occurrence

of that character

-t, --truncate-set1 first truncate SET1 to length of SET2

--help display this help and exit

--version output version information and exit

SETs are specified as strings of characters. Most represent themselves.

Interpreted sequences are:

\NNN character with octal value NNN (1 to 3 octal digits)

\\ backslash

\a audible BEL

\b backspace

\f form feed

\n new line

\r return

\t horizontal tab

\v vertical tab

CHAR1-CHAR2 all characters from CHAR1 to CHAR2 in ascending order

[CHAR*] in SET2, copies of CHAR until length of SET1

[CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0

[:alnum:] all letters and digits

[:alpha:] all letters

[:blank:] all horizontal whitespace

[:cntrl:] all control characters

[:digit:] all digits

[:graph:] all printable characters, not including space

[:lower:] all lower case letters

[:print:] all printable characters, including space

[:punct:] all punctuation characters

[:space:] all horizontal or vertical whitespace

[:upper:] all upper case letters

[:xdigit:] all hexadecimal digits

[=CHAR=] all characters which are equivalent to CHAR

Translation occurs if -d is not given and both SET1 and SET2 appear.

-t may be used only when translating. SET2 is extended to length of

SET1 by repeating its last character as necessary. Excess characters

of SET2 are ignored. Only [:lower:] and [:upper:] are guaranteed to

expand in ascending order; used in SET2 while translating, they may

only be used in pairs to specify case conversion. -s uses SET1 if not

translating nor deleting; else squeezing uses SET2 and occurs after

translation or deletion.

全是英文？翻译过来看下：

tr [选项]… 集合1 [集合2]

选项说明：

-c, -C, –complement 用集合1中的字符串替换，要求字符集为ASCII。

-d, –delete 删除集合1中的字符而不是转换

-s, –squeeze-repeats 删除所有重复出现字符序列，只保留第一个；即将重复出现字符串压缩为一个字符串。

-t, –truncate-set1 先删除第一字符集较第二字符集多出的字符

字符集合的范围：

\NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)

\\ 反斜杠

\a Ctrl-G 铃声

\b Ctrl-H 退格符

\f Ctrl-L 走行换页

\n Ctrl-J 新行

\r Ctrl-M 回车

\t Ctrl-I tab键

\v Ctrl-X 水平制表符

CHAR1-CHAR2 从CHAR1 到 CHAR2的所有字符按照ASCII字符的顺序

[CHAR*] in SET2, copies of CHAR until length of SET1

[CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0

[:alnum:] 所有的字母和数字

[:alpha:] 所有字母

[:blank:] 水平制表符，空白等

[:cntrl:] 所有控制字符

[:digit:] 所有的数字

[:graph:] 所有可打印字符，不包括空格

[:lower:] 所有的小写字符

[:print:] 所有可打印字符，包括空格

[:punct:] 所有的标点字符

[:space:] 所有的横向或纵向的空白

[:upper:] 所有大写字母

tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串：字符串1用于查询，字符串2用于处理各种转换。tr刚执行时，字符串1中的字符被映射到字符串2中的字符，然后转换操作开始。

通过使用 tr，您可以非常容易地实现 sed 的许多最基本功能。您可以将 tr 看作为 sed 的（极其）简化的变体：它可以用一个字符来替换另一个字符，或者可以完全除去一些字符。您也可以用它来除去重复字符。这就是所有 tr 所能够做的。

1、带有最常用选项的tr命令格式为

1	`tr` `-c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file`

这里：

-c 用字符串1中字符集的补集替换此字符集，要求字符集为ASCII。
-d 删除字符串1中所有输入字符。
-s 删除所有重复出现字符序列，只保留第一个；即将重复出现字符串压缩为一个字符串。
input-file是转换文件名。虽然可以使用其他格式输入，但这种格式最常用。

2、字符范围

指定字符串1或字符串2的内容时，只能使用单字符或字符串范围或列表。
[a-z] a-z内的字符组成的字符串。
[A-Z] A-Z内的字符组成的字符串。
[0-9] 数字串。
\octal 一个三位的八进制数，对应有效的ASCII字符。
[O*n] 表示字符O重复出现指定次数n。因此[O*2]匹配OO的字符串。

tr中特定控制字符的不同表达方式

速记符含义八进制方式

\a Ctrl-G 铃声\007

\b Ctrl-H 退格符\010

\f Ctrl-L 走行换页\014

\n Ctrl-J 新行\012

\r Ctrl-M 回车\015

\t Ctrl-I tab键\011

\v Ctrl-X \030

3、实例

1、将文件file中出现的"abc"三个字符替换为"xyz"三个字符。

注意：1，替换字符的个数只能是SET1的个数。如下例，输出的字符的个数为SET1的字符个数。

2，以单个字符为单位进行替换，而不是字符串。

[root@Gin scripts]# cat t.txt

abc

[root@Gin scripts]# cat t.txt |tr "abc" "xyz"

xyz

[root@Gin scripts]# cat t.txt

abc

[root@Gin scripts]# echo "abc" | tr "abc" "hijk"

hij

[root@Gin scripts]# echo "abc" | tr "adc" "hijk

hbj //因为在输入字符中没有d字符，所以不做替换。

[root@Gin scripts]# echo "abcd" | tr "adcd" "hij" hbjj

【注意】这里，凡是在t.txt文件中出现的"a"字母，都替换成"x"字母，"b"字母替换为"y"字母，"c"字母替换为"z"字母。而不是将字符串"abc"替换为字符串"xyz"。这里的替换不修改源文件

2、使用tr命令“统一”字母大小写

[root@Gin scripts]# cat file

abc

[root@Gin scripts]# cat file|tr [a-z] [A-Z]

ABC

大写转小写只需要把tr后面的参数换个位置即可！

3、把文件中的数字0-9替换为a-j

1 2	`[root@Gin scripts]# cat file\|tr [0-9] [a-j]` `abcdefghij`

4、删除文件file中出现的"Snail"字符

[root@Gin scripts]# cat file

what is Snail

[root@Gin scripts]# cat file|tr -d "Snail"

wht s

[root@Gin scripts]# cat file

what is Snail

【注意】这里，凡是在file文件中出现的'S','n','a','i','l'字符都会被删除！而不是紧紧删除出现的"Snail”字符串。

5、删除文件file中出现的换行'\n'、制表'\t'字符

1	`# cat file \| tr -d "\n\t"`

不可见字符都得用转义字符来表示的，这个都是统一的。

7、删除空行

1	`# cat file \| tr -s "\n" > new_file`

8、删除Windows文件“造成”的'^M'字符

# cat file | tr -d "\r"

或者

# cat file | tr -s "\r" "\n"

【注意】这里-s后面是两个参数"\r"和"\n"，用后者替换前者

9、用空格符\040替换制表符\011

1	`# cat file \| tr -s "\011" "\040"`

10、把路径变量中的冒号":"，替换成换行符"\n"

1	`# echo $PATH \| tr -s ":" "\n"`

4、实例应用

实际应用1，加密解密：

[root@Gin scripts]# echo 12345|tr '0-9' '987654321' ## 加密

87654

[root@Gin scripts]# echo 87654|tr '987654321' '0-9' ## 解密

12345

上面是一个非常有趣的小例子，通过映射来实现简单的加密解密，看懂这个例子，可以接着往下看古罗马时期发明的凯撒加密的一种变体ROT13

[root@Gin scripts]# echo "hi,this is amosli" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm'

uv,guvf vf nzbfyv

[root@Gin scripts]# echo "uv,guvf vf nzbfyv" | tr 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' 'NOPQRSTUVWXYZABCDEFGHIJKLMnopqrstuvwxyzabcdefghijklm'

hi,this is amosli

ROT13是它自己本身的逆反；也就是说，要还原ROT13，套用加密同样的算法即可得，故同样的操作可用再加密与解密。非常神奇！

实际应用2，字符集补集：

1	`tr` `-c [set1] [set2]`

set1的补集意味着从这个集合中包含set1中没有的所有字符。最典型的用法就是从输入文本中将不在补集中的所有字符全部删除。例如：

1 2	`[root@Gin scripts]# echo "hello 123 world " \| tr -d -c '0-9 \n'` `123`

在这里，补集中包含了除数字、空格字符和换行符之外的所有字符，因为指定了-d，所以这些字符全部都会被删除。

实际应用3，用tr压缩字符:

1 2	`[root@Gin scripts]# echo "GNU is not UNIX . Recursicve right?" \| tr -s ' '` `GNU is not UNIX . Recursicve right?`

使用-s参数可以压缩字符串中重复的字符。看另一个例子：

[root@Gin scripts]# cat sum.txt

5

4

3

5

4

3

[root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') 0 ]

24

[root@Gin scripts]# cat sum.txt|echo $[ $(tr '\n' '+') ]

-bash: 5+4+3+5+4+3+ : syntax error: operand expected (error token is "+ ")

这里，运用tr实现了加法运算， tr '\n' '+'使用换行符来替换为'+'然后连接起来，最后多出来一个'+'再接上数字0即实现了加法。

Linux

更多推荐

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏

Linux

所有评论(0)

查看更多评论

Leo606

@Brouce__Lee

已为社区贡献4条内容