#!/sbin/ksh
dir=${1:-.}
(cd $dir;pwd)
find $dir -type d -print | du | awk '{print $2, "== ("$1/2"kb)"}' |sort -f |
sed -e "s,[^ /]*/([^ /]*) ==,|--1," -e"s,[^ /]*/,| ,g"
#The End
感觉有些难度,不知哪位大侠能够给在下解释一下!
第五行是紧跟在第四行之后的,由于太长被强制换行了。
这个程序包含的知识点比较多,如果不是在这些点方面均有了解的话,理解起来会比较困难。但是仔细分析搞懂,还是很有收获的。因此在这里细细解读一下:
程序目的:
对指定的目录,显示该目录及其下所有子目录所占用的空间。显示方式上,要求以类windows树状结构的方式表现目录和子目录的关系,显示空间大小用(?kb)的样式说明。
程序代码:
(1)#!/sbin/ksh
(2)dir=${1:-.}
(3)(cd $dir;pwd)
(4)find $dir -type d -print | du | awk '{print $2, "== ("$1/2"kb)"}' |sort -f | sed -e "s,[^ /]*/([^ /]*) ==,|--1," -e"s,[^ /]*/,| ,g"
(1)表明使用的shell解释器为ksh
(2)对变量dir赋值,如果执行该程序时指定了第一参数$1,那么dir的值即为$1(即指定目录),如果没有指定参数,那么dir的值为"."(即当前目录)。这种变量设置的模式还有=value、+value、:?value、?value、:=value、:-value,各有其功能。
(3)为了首先显示一下处理的路径所在的主目录,需要进至该目录,然后用pwd命令显示出来。用()括起来,表示这两句作为一组命令一起执行,而且有个重要的好处就是执行完后不会影响程序的当前路径,可以理解是()使其内部命令在一子shell中运行,一旦执行完毕便恢复原shell的环境。
(4)这句是关键。
首先find $dir -type d -print表明要把$dir指定的目录下所有的子目录都找到并显示出来。-type d说明找的是目录而不是文件。
然后,使用du命令显示每一目录所占空间由于du命令显示的单位是512字节块,因此要将得到的值除以2,得到kb值。根据du的输出结果,第二列是目录,第一列是值,因此使用awk分别处理,$1/2的表达式要用引号引起是要让awk正确识别表达式。
sort -f是要把输出的结果排序,按字母顺序排序,便于使用的人察看。使用-f可以让sh排序时对大小写不敏感。
sed一句是关键中的关键,-e的写法可以使sed连续执行多套命令,此处有两个-e。来看命令集:s打头,表明了是一个替换任务,跟我们熟悉的不同,我们平时用s/aa/bb/这样的形式较多,但对于sed来说,分隔符是可以自行任意指定的,这里sed将跟在s命令后的","作为了分隔符。于是就有了s,...,...,的样子。
我们知道格式是“s/源串/目标串/”,那么第一组命令,源串是说什么呢?[]的用法在sed中表示:取[]字符组中的一个字符,而[]中的第一位若是"^",则表示不取后面的任何一个字符。那么[^ /]*/就表示匹配这样的格式:"由不是空格或/的一个或多个字符组成的串,后面紧跟一个/",接下来有(......)的格式,这种格式用在源串中,表示用这种符号括注的部分要sed记住,而且sed会给这个部分自动起个名字叫1,如果在源串中还有这样的标记,就依次命名为2,3......。这1要sed记住什么呢?是"[^ /]*",这还是说"由不是空格或/的一个或多个字符组成的串"。1之后还有" =="也是源串中要求匹配的。再来看目标串,就是要替换成的串,是"|--1",作者认为"|"是特殊字符,所以前跟号(其实不必)。"--"是普通符号了,1就是我们刚才在源串中要求标记的部分,换到这里来。
第二组命令简单一些。源串:"[^ /]*/",仍然是"由不是空格或/的一个或多个字符组成的串,后面紧跟一个/",目标串是"| ",最后一个g表明全行替换,就是说如果在一行中有多处匹配源串,都要替换成目标串。
再从该程序应用的角度看这一句的功能:
作者是要把这样的显示结果
. == (904724kb)
./bak == (1kb)
./billfile == (1kb)
./bin == (11646kb)
./bin../misc == (16kb)
....................
替换成这样的结果
. == (904724kb)
|--bak (1kb)
|--billfile (1kb)
|--bin (11646kb)
| |--images (16kb)
....................
对于"aaa/xxxx/yyyy =="分解这一要求,实际是两步,先把"xxxx/yyyy =="替换为"|--yyyy",然后将aaa变成"| "(如没有aaa则无行为),在aaa中含有几个/,就换成几个"| "。这里的sed命令恰好完成了这一功能。
程序改进:
(1)实际该程序没有使用ksh的任何特殊功能,改为sh仍可正常运行,兼容性会更好。
(2)先find再du是没有必要的。因为du本身就能寻找子目录,且自动显示每个子目录的大小。另外,如果对指定的目录无读权限的话,find就会报出错,但直接用du则没事。
(3)"|"在sed中不是特殊字符不必再用""转义了。
最后我的建议结果如下:
#!/bin/sh
dir=${1:-.}
(cd $dir;pwd)
du $dir| awk '{print $2, "== ("$1/2"kb)"}' |sort -f|sed -e "s,[^ /]*/([^ /]*) ==,|--1," -e "s,[^ /]*/,| ,g"
michaelds 解释的太好了。
我想我们大家在注意shell的时候,应该注意shell中处处用得到的正则表达式。
^,$,.,*,[] 应该很清楚,这样在sed ,awk,case,vi ...里都能顺畅自如.