文本处理工具

文本处理工具
1、查看文件内容
cat -v 显示非打印字符
      -E 显示$
     -T 显示TAB
     -n 显示行号
     -s 将连续的重复空行变成一行
     -A = -vET
less
2、文件截取
head -n 行号 显示前n行
          -行号 显示前n行
          -c 字节数 显示前n个字节
tail -n 行号 显示后n行
       -行号 显示后n行
       -c 字节数 显示后n个字节
       -f 动态显示
3、按列抽取
cut -d 指定分隔符
       -f 选取第几列

截取列,并指定分隔符

clipboard

paste paste f1 f2 [f3]
paste -s f1 将文件内容变成一行显示 也可以用 tr ‘\n’ ‘\t’ 实现
paste -d “” f1 f2 [f3] 合并后的分隔符,默认TAB
4、按关键字抽取行
grep –color=auto 将匹配的结果着色显示
         -v 反向匹配
         -i 忽略大小写
         -n 显示的结果前增加行号
         -c 仅显示匹配到结果的行数
         -o 仅显示匹配到的字符串
         -q 静默模式,不输出任何信息
             或者 &> /dev/null
         -A# 显示关键字行及向后#行
         -B# 显示关键字行及向前#行
           nmap -v -sP 172.17.252.0/24 |grep -B1 “Host is up”|grep for |cut -d” ” -f5 |wc -l
         -C# 显示关键字向前#行,当前行,及向后#行
         -e 关键字1 -e 关键字2 实现多个选项间的逻辑or关系
         -w 匹配整个单词
         -E 使用扩展正则表达式 或egrep
         -F 不使用正则表达式 或 fgrep
5、收集文本统计数据
wc -m 字符数
      -c 字节 一个汉字3字节,一个单词一字节
      -l 行数
    -w 单词数
6、文本排序
sort -r 执行反方向(由上至下)整理
       -n 执行按数字大小整理
       -f 选项忽略(fold)字符串中的字符大小写
       -u 选项(独特,unique)删除输出中的重复行
       -t c 选项使用c做为字段界定符
       -k X 选项按照使用c字符分隔的X列来整理能够使用多次
uniq 去除连续的重复行要想去除非连续的行,先用sort排序
         -c 显示连续重复的次数
         -d 仅显示重复的次数
         -u 仅显示不曾重复的行
         sort userlist.txt | uniq -c 常配合使用用来统计重复次数排序
7、比较文件
diff -u f1 f2 > diff.log 生成补丁
patch -b f1 diff.log 通过补丁还原文件
正则表达式课后题
留给后人的一笔财富
1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)
cat /proc/meminfo|grep “^[Ss]”
cat /proc/meminfo|grep -i “^s”
cat /proc/meminfo|grep -e ^s -e ^S
cat /proc/meminfo|grep “^s\|^S”
cat /proc/meminfo|grep “^[s\|S]”
2、显示/etc/passwd文件中不以/bin/bash结尾的行

 grep -v “/bin/bash$” /etc/passwd

clipboard

3、显示用户rpc默认的shell程序
grep “^rpc\>” /etc/passwd | cut -d : -f7
grep -w “^rpc” /etc/passwd | cut -d : -f7

clipboard

4、找出/etc/passwd中的两位或三位数
cat /etc/passwd |grep -o “\<[0-9]\{2,3\}\>”

clipboard

5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白
字符开头的且后面存非空白字符的行
cat /etc/grub2.cfg |grep “^[[:space:]]\+[^[:space:]]”

clipboard

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多
个空白字符结尾的行
netstat -tan|grep “\<LISTEN\>[[:space:]]*$”

clipboard

7、显示CentOS7上所有系统用户的用户名和UID
cat /etc/passwd |cut -d: -f1,3 |grep “\<[[:digit:]]\{1,3\}\>”$

clipboard

注:centos7 系统用户UID<1000
8、添加用户bash、testbash、basher、sh、nologin(其shell
为/sbin/nologin),找出/etc/passwd用户名同shell名的行
cat /etc/passwd | grep “\(^.*\)\>.*\/\1$”

clipboard

9、仅利用df和grep和sort,取出磁盘各分区利用率,并从大到小排序
df |grep ^/dev/sd |grep -o “\b[[:digit:]]\{1,3\}\b%”|sort -rn

clipboard

注:取出磁盘分区dev/sd
!!!以下自己做的不确定对错
1、显示三个用户root、mage、wang、的UID和默认shell
[root@localhost ~]# cat /etc/passwd |grep -E “^(root|mage|wang)” |cut -d: -f3,7

clipboard

2、找出/etc/rc.d/init.d/functions文件行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost ~]# cat /etc/rc.d/init.d/functions |grep “.*()”

clipboard

3使用egrep取出/etc/rc.d/init.d/functions中其基名

clipboard

4、使用egrep取出上面路径的目录名
[root@localhost ~]# echo /etc/rc.d/init.d/functions |egrep -o “^(/).*\1”

clipboard

5、统计last命令中以root登录的每个主机IP地址登录次数

clipboard

6、利用扩展正则表达式分别表示0-9、10-99、100-199、200-249、250-255

clipboard

7、显示ifconfig命令结果中所有IPv4地址
[root@centos6 ~]# ifconfig |grep -w “inet addr” |tr -s ” ” “:” |cut -d: -f4

clipboard

[root@centos6 ~]# ifconfig |egrep -o “([0-9]{3}(\.[0-9]{1,3}){3})”

clipboard

8、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面

clipboard

原创文章,作者:jieran,如若转载,请注明出处:/83389

发表评论

登录后才能评论

联系我们

400-080-6560

在线咨询:点击这里给我发消息

邮件:1823388528@qq.com

工作时间:周一至周五,9:30-18:30,节假日同时也值班

友情链接:万达娱乐招商  万达主管  测试  万达直属  万达登录  万达娱乐平台  guoqibee.com  万达主管QQ  万达娱乐主管  万达开户