Linux文本处理三剑客之awk详解

前言

awk是一款强大的报告生成器,不同于sed和grep,它的侧重点是如何把文本信息更好的展示出来,常用与统计和格式化输出。awk相当于微型的shell,有着自己一套语法结构,例如:循环结构,数组,条件判断,函数,内置变量等功能。处理对象一般纯文本文件或纯文本信息。

用法详解

基本语法

awk的输出

① 各项目之间使用逗号分隔,而输出时则使用输出分隔符分隔

② 输出的各item可以字符串或数值、当前记录的字段、变量或awk的表达式,数值会被隐式转换为字符串后输出

③ print后面item如果省略,相当于print $0,若输出空白,使用pirnt ""

1.jpg

2.jpg

模式

① Regexp: 格式为/PATTERN/,仅处理被/PATTERN/匹配到的行

② Expression: 表达式,其结果为非0或非空字符串时满足条件,仅处理满足条件的行

③ Ranges: 行范围,此前地址定界,startline, endline,仅处理范围内的行

④ BEGIN/END: 特殊模式,仅在awk命令的program运行之前(BEGIN)或运行之后(END)执行一次

⑤ Empty:空模式,匹配任意行

awk的变量

内置变量

3.jpg

4.jpg

5.jpg

6.jpg

7.jpg

可自定义变量

①可以program中定义变量

② 可以命令行中通过-v选项自定义变量

9.jpg

awk的printf命令

① 要指定format

②不会自动换行;如需换行则需要给出\n

③format用于为后面的每个item指定其输出格式

10.jpg

awk输出重定向

11.jpg

awk的操作符

例:判断UID是否大于等于500,如果为真就显示为普通用户,如果为假就显示为系统或管理用户

12.jpg

常用的action

①Expressions:表达式 赋值等

② Control statements:条件语句,控制语句if while…

③Compound statements:组合语句

④ input statements:输入语句

⑤ output statements:输出语句

控制语句

if-else

例:uid>=500的用户显示为普通用户,否则显示为管理用户

13.jpg

例:显示文件中字段数大于等于8的行

14.jpg

while

例:只显示奇数行

15.jpg

例:只输出每行大于6的字段

16.jpg

do-while循环

例:输出1到100之和

17.jpg

for循环

例:显示奇数行

18.jpg

例:输出每行大于6的字段

19.jpg

for循环可用来遍历数组元素

例:A中保存数组,B中保存数组下标

20.jpg

case语句

 循环控制

next

提前结束对本行的处理进而进入下一行的处理

例:显示用户id为奇数的用户

21.jpg

例:输出奇数行的用户

22.jpg

数组

关联数组

要遍历数组中的每一个元素,需要使用如下特殊结构

例:统计每一种网络连接出现的次数

23.jpg

例:统计web服务访问日志中的ip访问量

24.jpg

删除数组元素

关系数组中删除数组索引需要使用delete命令

awk的内置函数

例:统计连接请求的ip

25.jpg

The end

好了,awk的用法就先说到这里了,awk不仅强大,而且看的我头大,有兴趣的可以深入研究,此篇就不继续深入了。以上仅为个人学习整理,如有错漏,大神勿喷~~~

原创文章,作者:书生,如若转载,请注明出处:/3770

联系我们

400-080-6560

在线咨询:点击这里给我发消息

邮件:1823388528@qq.com

工作时间:周一至周五,9:30-18:30,节假日同时也值班

友情链接:万达娱乐主管QQ  万达娱乐直属  万达娱乐平台  万达娱乐招商QQ  万达注册  万达娱乐招商  万达直属QQ  万达娱乐主管QQ  万达娱乐开户