本文共 7621 字,大约阅读时间需要 25 分钟。
1. 如何在一个文本文件中的每一行头插入一个字符
2. 如何在一个文本文件中的每一行尾插入一个字符
3. 如何在一个文本文件中的每一行的指定列插入一串字符
1.awk '{print "X"$0}' urfile
2.awk '{print $0"X"}' urfile
3.awk '$O=$O" X"' urfile
sed全名叫stream editor,流编辑器(也叫行编辑器),其处理文本的方式为一行一行的,不同于vi等全屏编辑器;主要用途为通过匹配一个或多个正则表达式来对文本进行处理,实现过滤和转换文本。
sed 的工作方式
sed 实用工具按顺序逐行将文件读入到内存中。然后,它执行为该行指定的所有操作,并在完成请求的修改之后将该行放回到内存中,以将其转储至终端。完成了这一行 上的所有操作之后,它读取文件的下一行,然后重复该过程直到它完成该文件。如同前面所提到的,默认输出是将每一行的内容输出到屏幕上(特别要注意这点,因此一般要配合-n参数不让其显示不需要的)。在这里,开始涉及到 两个重要的因素—首先,输出可以被重定向到另一文件中,以保存变化;第二,源文件(默认地)保持不被修改。sed 默认读取整个文件并对其中的每一行进行修改。不过,可以按需要将操作限制在指定的行上。
通过man命令查看sed帮助如下:
NAME
sed – stream editor for filtering and transforming textSYNOPSIS
sed [OPTION]… {script-only-if-no-other-script} [input-file]…
用便于理解的表示其用法如下:
sed [options] ‘AddressCommand’ file …
其中AddressCommand表示对需要处理的范围(地址)执行的命令
-n: 静默模式,不再默认显示模式空间中的内容
-i: 直接修改原文件
-e SCRIPT -e SCRIPT:可以同时执行多个脚本
-f /PATH/TO/SED_SCRIPT
sed -f /path/to/scripts file
-r: 表示使用扩展正则表达式
-n:显示出其他资料行的默认操作,只显示符合的数据行,如下面加-n选项和不加的显示效果是不一样的:
Address表示sed处理的范围,如第20到30行、以root开头的行等等。主要有如下几种:
指定行:StartLine,EndLine
5,30 表示第5至30行
[root@localhost ~]# sed ‘5,30d’ /etc/passwd ##删除5至30行内容(不会修改原文件)
root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin
$ 表示最后一行
正则表达式匹配:/RegExp/
sed正则表达式的用法基本与grep一样,如:
[root@localhost ~]# sed ‘/nologin$/d’ /etc/passwd ##删除以nologin结尾的行
root:x:0:0:root:/root:/bin/bash sync:x:5:0:sync:/sbin:/bin/sync shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown halt:x:7:0:halt:/sbin:/sbin/halt barlow:x:500:500::/home/barlow:/bin/bash
/pattern1/,/pattern2/
第一次被pattern1匹配到的行开始,至第一次被pattern2匹配到的行结束,这中间的所有行
指定具体的行:LineNumber
从某行开始及后面的多少行:addr1,+N
上面的5,30 等于5,+25
[root@localhost ~]# sed ‘5,+25d’ /etc/passwd
root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin
在将Command之前,需要再次强调的是,Address和Command之间是直接相连的,中间没有空格或者其他符号。
Command主要有如下这些:
d: 删除符合条件的行;参见前面Address部分的示例。
p: 显示符合条件的行;需要注意的是,文章第二段红字部分已经强调了,sed默认会把处理的文本一行行输出到终端,因此直接用p命令看不出什么效果。
a \string: 在指定的行后面追加新行,内容为string,如下面的例子将在文本最后添加一行内容,注意cat看到结果与sed处理结果的差异:
\n:可以用于换行
i \string: 在指定的行前面添加新行,内容为string
r FILE: 将指定的文件的内容添加至符合条件的行处,如在fstab第二行后添加issue文件的内容
w FILE: 将地址指定的范围内的行另存至指定的文件中;
s/pattern/string/修饰符: 查找并替换,默认只替换每行中第一次被模式匹配到的字符串
修饰符主要有:
g: 全局替换 i: 忽略字符大小写 注意,替换命令的三个/可以用其他字符替换,如:s@pattern@string@修饰符
s#pattern#string#修饰符
这些都是可以的,只要三个分隔符一样即可。
sed的查找替换功能参照我以前的博文:
&: 引用模式匹配整个串
[root@localhost ~]# sed ‘s/^[ ]*//g’ filename
[root@localhost ~]# sed ‘s/^ *//g’ filename [root@localhost ~]# sed ‘s/^[[:space:]]*//g’ filename
行后:
[root@localhost ~]# sed ‘s/pattern/&\n/g’ filename
行前:
[root@localhost ~]# sed ‘s/pattern/\n&/g’ filename
注意:&代表pattern
[root@localhost ~]# sed -e “s/$var1/$var2/g” filename
sed -i ‘1 i\插入字符串’ filename
[root@localhost ~]# sed -i ‘$ a\插入字符串’ filename
[root@localhost ~]# sed -i ‘/pattern/ i “插入字符串”‘ filename
[root@localhost ~]# sed -i ‘/pattern/ a “插入字符串”‘ filename
[root@localhost ~]# grep -v ‘^#’ filename | sed ‘/^[[:space:]]*$/d’
[root@localhost ~]# df -P |sed -r ‘s/[[:space:]]+/:/g’
##-P 选项表示df输出信息不自动换行
##[[:space:]]+匹配表示空格至少出现一次
一、sed (Stream Editor)
1、定位行:
sed -n '12,~3p' pass #从第12行开始,直到下一个3的倍数行(12-15行) sed -n '12,+4p' pass #从第12行开始,连续4行(12-16行) sed -n '12~3p' pass #从第12行开始,间隔3行输出一次(12,15,18,21...) sed -n '10,$p' pass #从第10行至结尾 sed -n '4!p' pass #除去第4行2、正则:'/正则式/'
sed -n '/root/p' /etc/passwd sed -n '/^root/p' /etc/passwd sed -n '/bash$/p' /etc/passwd sed -n '/ro.t/p' /etc/passwd sed -n '/ro*/p' /etc/passwd sed -n '/[ABC]/p' /etc/passwd sed -n '/[A-Z]/p' /etc/passwd sed -n '/[^ABC]/p' /etc/passwd sed -n '/^[^ABC]/p' /etc/passwd sed -n '/\<root/p' /etc/passwd sed -n '/root\>/p' /etc/passwd3、扩展正则:
sed -n '/root\|yerik/p' /etc/passwd #拓展正则需要转义 sed -nr '/root|yerik/p' /etc/passwd #加-r参数支持拓展正则 sed -nr '/ro(ot|ye)rik/p' /etc/passwd #匹配rootrik和royerik单词 sed -nr '/ro?t/p' /etc/passwd #?匹配0-1次前导字符 sed -nr '/ro+t/p' /etc/passwd #匹配1-n次前导字符 sed -nr '/ro{2}t/p' /etc/passwd #匹配2次前导字符 sed -nr '/ro{2,}t/p' /etc/passwd #匹配多于2次前导字符 sed -nr '/ro{2,4}t/p' /etc/passwd #匹配2-4次前导字符 sed -nr '/(root)*/p' /etc/passwd #匹配0-n次前导单词4、sed编辑(对行的插入、删除、替换操作)
sed '/root/a admin' /etc/passwd #在root行后追加一个admin行 sed '/root/i admin' /etc/passwd #在root行前插入一个admin sed '/root/c admin' /etc/passwd #将root行替换为admin sed '/root/d' /etc/passwd #删除含有root的行s替换
sed -n 's/root/admin/p' /etc/passwd sed -n 's/root/admin/2p' /etc/passwd #在每行的第2个root作替换 sed -n 's/root/admin/gp' /etc/passwd sed -n '1,10 s/root/admin/gp' /etc/passwd sed -n 's/root/AAA&BBB/2p' /etc/passwd #将root替换成AAArootBBB,&作反向引用,代替前面的匹配项 sed -ne 's/root/AAA&BBB/' -ne 's/bash/AAA&BBB/p' /etc/passwd #-e将多个命令连接起来,将root或bash行作替换 sed -n 's/root/AAA&BBB/;s/bash/AAA&BBB/p' /etc/passwd #与上命令功能相同 sed -nr 's/(root)(.*)(bash)/\3\2\1/p' /etc/passwd #将root与bash位置替换,两标记替换 或sed -n 's/\(root\)\(.*\)\(bash\)/\3\2\1/p' /etc/passwd bash:x:0:0:root:/root:/bin/rooty替换
echo "sorry"|sed 'y/ory/ABC/' #一一对应替换(sABBC)6、sed的模式空间和保持空间 h:模式---->保持 H:模式--->>保持 x:模式<--->保持 g:保持---->模式 G:保持--->>模式
例如:
111 222 333 444 # sed '1h;2,3H;4G'分析
CMD 模式 保持 111 111 \n 1h 111 111 ----------->111 222 222 111 2,3H 222 111\n222 ----------->222 333 333 111\n222 2,3H 333 111\n222\n333 ----------->333 444 444 111\n222\n333 4G 444\n111\n222\n333 ----------->444\n111\n222\n3331-10 11-22 22-33 11-22 34-END
7、sed特殊用法
sed -n '/root/w a.txt' #将匹配行输出到文件 sed '/root/r abc.txt' /etc/passwd #把abc.txt的文件内容读入到root匹配行后 sed -n '/root/w a.txt' sed -n '/root/{=;p}' /etc/passwd #打印行号和匹配root的行 sed -n '/root/{n;d}' /etc/passwd #将匹配root行的下一行删除 sed -n '/root/{N;d}' /etc/passwd #将匹配root行和下一行都删除 sed '22{h;d};23,33{H;d};44G' pass8、sed 脚本编写方法
<1>从文件读入命令 sed -f sed.sh sed.sh文件内容: s/root/yerik/p s/bash/csh/p<2>直接运行脚本 ./sed.sh /etc/passwd
#!/bib/sed -f s/root/yerik/p s/bash/csh/p################################### 二、Sed练习
1,删除文件每行的第一个字符。
sed -n 's/^.//gp' /etc/passwd sed -nr 's/(.)(.*)/\2/p' /etc/passwd 2,删除文件每行的第二个字符。 sed -nr 's/(.)(.)(.*)/\1\3/p' /etc/passwd3,删除文件每行的最后一个字符。
sed -nr 's/.$//p' /etc/passwd sed -nr 's/(.*)(.)/\1/p' /etc/passwd4,删除文件每行的倒数第二个字符。
sed -nr 's/(.*)(.)(.)/\1\3/p' /etc/passwd5,删除文件每行的第二个单词。
sed -nr 's/([^a-Z]*)([a-Z]+)([^a-Z]+)([a-Z]+)(.*)/\1\2\3\5/p' /etc/passwd6,删除文件每行的倒数第二个单词。
sed -nr 's/(.*)([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]*)/\1\2\4\5\6/p' /etc/samba/smb.conf7,删除文件每行的最后一个单词。
sed -nr 's/(.*)([^a-Z]+)([a-Z]+)([^a-Z]*)/\1\2\4/p' /etc/samba/smb.conf8,交换每行的第一个字符和第二个字符。
sed -nr 's/(.)(.)(.*)/\2\1\3/p' /etc/passwd9,交换每行的第一个单词和第二个单词。
sed -nr 's/([^a-Z]*)([a-Z]+)([^a-Z]+)([a-Z]+)(.*)/\1\4\3\2\5/p' /etc/samba/smb.conf10,交换每行的第一个单词和最后一个单词。
sed -nr 's/([^a-Z]*)([a-Z]+)([^a-Z]+)([a-Z]+)(.*)/\1\4\3\2\5/p' /etc/passwd11,删除一个文件中所有的数字。
sed 's/[0-9]*//g' /etc/passwd12,删除每行开头的所有空格。
sed -n 's/^\ *//p' /etc/samba/smb.conf sed -nr 's/( *)(.*)/\2/p' testp13,用制表符替换文件中出现的所有空格。
sed -n 's/\ /\t/gp' pass14,把所有大写字母用括号()括起来。
sed -nr 's/([A-Z])/(&)/gp' testp sed -n 's/[A-Z]/(&)/gp' testp15,打印每行3次。
sed 'p;p' pass16,隔行删除。
sed -n '1~2p' pass17,把文件从第22行到第33行复制到第44行后面。
sed '1,21h;22h;23,33H;44G' pass18,把文件从第22行到第33行移动到第44行后面。
sed '22{h;d};23,33{H;d};44G' pass19,只显示每行的第一个单词。
sed -nr 's/([^a-Z]*)([a-Z]+)([^a-Z]+)(.*)/\2/p' /etc/passwd20,打印每行的第一个单词和第三个单词。
sed -nr 's/([^a-Z]*)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)(.*)/\2--\4/p' /etc/passwd21,将格式为 mm/yy/dd 的日期格式换成 mm;yy;dd
date +%m/%Y/%d |sed -n 's#/#;#gp'22, 逆向输出
cat a.txt ABC DEF XYZ 输出样式变成 XYZ DEF ABC
转载地址:http://hlsab.baihongyu.com/