全面详解linux下的sed命令

作为shell编程三剑客之一的sed,重要程度不言而喻。sed是一个流编程器,每次处理一行,处理完后再接着处理下一行,它支持正则,功能非常的强大。但sed比一般的命令复杂一些,选项繁多,想要掌握它是需要花点功夫的。下面我们通过众多的例子来看看这个强大的sed命令的作用吧!

语法格式:sed [选项] [动作]

常用选项如下:

  • -n:sed默认会输出所有stdin内容,但加上该选项后,只显示经过sed处理过的行。
  • -e :允许在同一行里执行多个动作
  • -f:从一个文件中读取动作
  • -i:直接修改文件而不是输入到屏幕上(危险

动作中的参数及太多了,下面列一下:

  • a:在匹配行下面加入一行
  • c:将匹配的行修改新的内容
  • d:删除匹配的行
  • i:在匹配行前加入内容
  • p:打印
  • s:替换匹配行的内容

范例一:打印/etc/passwd文件的第5-10行

# sed -n '5,10p' /etc/passwd
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin

范例二:删除/etc/passwd文件的第2行,第2到10行

# cat -n /etc/passwd | sed '2d' | sed '5,10d'

除了上面的方法,我们还可以用-e选项来完成

# cat -n /etc/passwd | sed -e '2d' -e '5,10d'

下面我们再来补充点关于sed动作的知识

解释
x 指定行号
x,y x到y行号
/pattern/ 查询包含模式的行
/pattern/pattern/ 查询包含两个模式行
/pattern/,x 匹配行到x行
x,/pattern/ x行到匹配行
/pattern/,/pattern/ 查询两个模式之间的行
x,y! 不包含x至y行
sed 's/old/new/g' text.txt old全部替换成new,如果没有g则只替换第一个匹配到的
sed -n '1,3p' text.txt 打印第一行至第三行
sed 's/book/books/' file -n选项p命令一起使用表示只打印那些发生替换的行
sed -n '1p;$p' text.txt 打印第一行和最后一行
sed '1,3d' text.txt 删除第一至第三行
sed '/gwx/,$d' text.txt 删除匹配行至最后一行
sed '/gwx/a word' text.txt 查找gwx所在行,并在下一行插入word
sed '/gwx/i word' text.txt 查找gwx所在行,并在上一行插入word

范例三:获取服务器ip地址

这个案例非常的棒,建议大家仔细看看

# ifconfig eth0
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 172.26.9.143  netmask 255.255.240.0  broadcast 172.26.15.255
        ether 00:16:3e:0a:01:ad  txqueuelen 1000  (Ethernet)
……

我们需要的是172.26.9.143。

第一步,获取我们想要处理的行

# ifconfig eth0 | sed -n '/.*inet/p'
        inet 172.26.9.143  netmask 255.255.240.0  broadcast 172.26.15.255

第二步,将不需要的信息给替换位空白字符

# ifconfig eth0 | sed -n '/.*inet/p' | sed 's/.*inet\s\+//g'
172.26.9.143  netmask 255.255.240.0  broadcast 172.26.15.255

接下来把ip地址后面的全部替换位空就行了

# ifconfig eth0 | sed -n '/.*inet/p' | sed 's/.*inet\s\+//g' | sed 's/\s\+.*//g'
172.26.9.143

下面我们来说说上面的例子,首先第一步我们使用了-n和p来获取我们想要的行。然后,我们将不需要的信息进行过滤,需要注意的时,正则中\s+表示至少匹配一个空格,但在这里需要在加号前使用转义字符\。

范例四

最后一个范例,我给出我昨天一个真实案例。需求是这样的,获取一段文本中的url地址,但不需要前面的http://。部分文本内容如下:

            <td width=820> <a href=http://beijing.hellozx.com onclick="co('beijing')"><font color="red">北京</font></a>
                 <a href=http://shanghai.hellozx.com onclick="co('shanghai')"><font color="red">上海</font></a>
                 <a href=http://tianjin.hellozx.com onclick="co('tianjin')"><font color="red">天津</font></a>
                 <a href=http://chongqing.hellozx.com onclick="co('chongqing')"><font color="red">重庆</font></a></td></tr>

<tr><td width=80 height=30 align=right>
<b><font style="font-size:14px;">山东</font>:</b> </td><td width=820>

 <a href="http://jinan.hellozx.com" onclick="co('jinan')"><font color=red style="font-size:14px;">济南</font></a>

 <a href="http://qingdao.hellozx.com" onclick="co('qingdao')"><font color=red style="font-size:14px;">青岛</font></a>

下面我们分几步去完成该需求,首先,将不含url地址的行全部过滤

# sed -n '/http:/p' a.txt

然后,将不需要的信息全部替换位空白字符即可。先把http://及之前字符全部删除

sed -n '/http:/p' a.txt | sed 's/.*http:\/\///g'

,接着把双引号及之后字符全部删除

# sed -n '/http:/p' a.txt | sed 's/.*http:\/\///g' | sed 's/".*//g'

现在屏幕输出的内容如下

haikou.hellozx.com
sanya.hellozx.com
kunming.hellozx.com
dali.hellozx.com
xining.hellozx.com
yinchuan.hellozx.com
wulumuqi.hellozx.com
……

发表评论

电子邮件地址不会被公开。 必填项已用*标注