BASH Shell的脚本编程
报告人 bjchenxu (ChinaUnix/linux版)
第一篇:超级工具/terminals,xterms 和 shells
shell是一个全功能的编程环境。其背景知识如下。
DEC公司推出的 PDP-11 ,体积小(被称为 mini)而且价格低(10000$),在大学中引起
了巨大的反响。为了方便移植,1969 年,Ken Thompson 开始写后来成为 Unix(与MULTICS相
对)的第一行代码。后来, Dennis Ritchie为这个新的操作系统设计了一种新的编程语言--
C 语言。
虽然 Unix 的效率不及原来的操作系统,但有三个突出的优点:
1. 可以任意移植到其他机器
2. 其中的 C 语言大大简化了编程
3. free。
终端(terminals)
Unix是可以在许多种机器上运行的操作系统,但人们又如何使用这些机器呢?他们是通过
哑终端来连接到这些机器,也就是用键盘、显示器及足够的 electronics(电子元件)组成的
机器与中央计算机(central computer)相连。在这些终端上,用户可以敲字符(teletypy),
这就是字符串'tty'表示终端设备文件,和'getty'命令的名称来历。
为了避免键盘布局的混乱,人们创建了一个含有所有不同终端特性的(capability)文件,
这就是'termcap',参见'/etc/termcap'。linux 终端大多数用'vt100'或'linux'作为终端类型。
xterms
在八十年代初期,产生了X Window System 。九十年代早期,产生了XFree86 。
X Window 中一个很大的好处是可以运行多个虚拟(virtual)终端。甚至在 X Window 下就
有这么个应用程序--'xterm'。您将发现'xterm'和'virtual terminal'在很多情况下都是一样
的。其他的终端模拟器(terminal emulator),如 rxvt、konsole、aterm、eterm、wterm 等等。
终端模拟器(又称为虚拟终端)通过伪(pseudo) tty 设备-- pty 与系统相连,并且使用
自己的显示标准--xterm 。这导致不同的终端模拟器可能在一些按键或程序上存在细小的差别,
这取决于模拟器多大程度上遵守了'xterm'的显示标准。
shells
shell是用户和linux(或者更准确的说,是你和Linux内核)之间的接口程序。 你
在提示符下输入的每个命令都由shell先解释然后传给linux内核。
为了在终端中运行程序,需要 shell 。shell 是操作系统的一部分,用来与用户打交道,
并且可以用来协调各个命令。
第一个真正的 Unix shell -- 'sh',亦称为'Bourne shell',诞生于 1975 年, 作者是
Steve Bourne 。很快,出现了其他 shell ,如基于原始'Bourne shell'的'ksh'、'zsh',后
者常用作专属 Unixes 系统中的标准 shell ;也有一些从 C 语言中衍生出来的 shell , 如
'csh'或'tcsh'。
在 linux 中,标注的 shell 是'bash',即 the GNU Bourne-Again Shell 。这个 shell
功能非常强大,压缩的 man page 就有 50 KB 。
Shell 起步
首先,有一点小说明:在平常应用中,建议您不要用'root'帐号运行 shell , 如果您还
是新手,这一点尤其要注意。作为普通用户,不管您有意还是无意,都无法破坏系统;但如果
是'root',那就不同了,只要敲几个字母,就可能导致灾难性后果。
当您登入系统或打开一个 xterm 窗口,首先看到的是提示符(prompt)。Red Hat linux
的标准提示符包括了您的用户名、登入的主机名(没有设置的话,是'localhost')、 当前所
在的目录(working directory)、提示符号:
[tom@belbo tom]$
我以用户名'tom'登入名为'belbo'的主机,当前在我的 home 目录--'/home/tom'中。
'root'的提示符:
[root@belbo root]#
除了不同的用户名外,提示符号由'$'变成了'#'。根据 Bourne shell 的传统,普通用户
的提示符以'$'结尾,而超级用户用'#'。
提示符的每个部分都可以定制,您在后面将有更深的了解。
要运行命令的话,您只要在提示符后敲进命令,然后在按 <ENTER> 键。shell将在其路径
中(详情见后)搜索这个命令,找到以后就运行,并在终端里输出相应的结果(如果有的话),
命令结束后,再给出新的提示符:
[tom@belbo tom]$ whoami
tom
[tom@belbo tom]$
当您敲 ENTER 时,光标(cursor)在哪里并不要紧,因为 shell 总是会整行地读取。
基本的命令有:'ls'(list directory ,列出目录内容)、'cp'(copy ,复制)、'mv'
(move / rename ,移动/重命名),'cd '(change directory ,改变目录),这些命令后
面都可以跟上一帮可选项,这方面 man page 有详细的介绍(man ls, man mv 等等)。
下面简单介绍一下几个术语(terminology)。
命令可能带一些可选项(options)、参数(arguments):
mv -i file dir
其中'-i'是命令'mv'的一个可选项,而'file'和'dir'则是参数。 所有可选项在该命令的
man page 都中有详细的介绍(此例中用 man mv),而参数则由您提供。可选项决定命令如何
工作,而参数则用于确定命令作用的目标。
第二篇:自动补齐/命令行的历史记录/编辑命令行/可用的 Shell 快捷方式
Unix (及后继者 linux)在命令行下面诞生,因此,Unix 中的命令行有许多非常实用的
功能。
自动补齐
如何用'cd'(改变目录,change directory)最快地从您当前所在的 home 目录跳到
'/usr/src/redhat/'呢?
cd /u<TAB>sr<TAB>r<TAB>
这称为'命令行自动补齐'(automatic command line completion), 这在平常应用中是不
可缺少的。让我们仔细看看这个例子:
cd /u<TAB>
扩展成了 cd /usr/ ,很简单吧。下面的
cd /u<TAB>sr<TAB>
扩展为 cd /usr/src/ 。
如果您只敲了cd /u<TAB>s<TAB>, '/usr'下匹配的('cd /u*/s*')三个子目录将列出供
您选择:'/usr/sbin'、'/usr/share'和'/usr/src'。
因此,<TAB> 键可以很方便地用于根据前几个字母,来查找匹配的文件或子目录。比如,
ls /usr/bin/zip<TAB> 将列出所有'/usr/bin'下面,以字符串'zip'开头的文件或子目录。当
然,完成这类任务还有更厉害的命令,但这个方法确实很管用。
另外,碰到长文件名时就显得特别方便。假设您要安装一个名为
'boomshakalakwhizbang-4.6.4.5-i586.rpm'的 RPM 包,您输入 rpm -i boom<TAB> ,如果目
录下没有其他文件能够匹配,那 shell 就会自动帮忙补齐。
cd /u<TAB>sr<TAB>l<TAB>
将扩展成 cd /usr/src/linux ,并等待继续。'/usr/src'中有两个匹配的目录:
'/usr/src/linux-[...]'、'/usr/src/linux'。如何告诉 shell 您想要后面的那个呢? 只要
跟一个斜线(/ ,slash),就可以选择后面的那个了。
假如您不确定是'/usr/src/linux/Documentation'还是'/usr/src/linux/documentation'。
而您知道,linux 是区分大小写的。如果已经仔细读过前面部分的话,您想到可以用:
cd /u<TAB>sr<TAB>l<TAB>/d<TAB>
扩展成了'/usr/src/linux/drivers/',因此应该是'Documentation'(大写的'D')。
这种补齐对命令也有效:
[tom@belbo tom]$ gre<TAB>
grecord grefer grep
[tom@belbo tom]$ gre
在这里 shell 将列出所有以字符串'gre'开头的已知命令。
命令行的历史记录
通过按向上方向键,您可以向后遍历近来在该控制台下输入的命令。用向下方向键可以向
前遍历。与 SHIFT 键连用的话,您还可以遍历以往在该控制台中的输出。 您也可以编辑旧的
命令,然后再运行。
按 <CTRL r> 后,shell 就进入"reverse-i(ncremental)-search"(向后增量搜索)模式。
现在输入您要找的命令的首字母:
(reverse-i-search)`':. 敲入 'i'可能会变成:
(reverse-i-search)`i': isdnctrl hangup ippp0
如果您再按 <ENTER> 键,上面的命令将再次执行。而如果您按了向右、向左方向键或
<ESC> ,上面的命令将回到普通的命令行,这样您就可以进行适当编辑。
编辑命令行
通过光标和功能键(Home、End 等键),您可以浏览并编辑命令行,如果您需要,还可以
用键盘的快捷方式来完成一般的编辑:
CTRL k : 删除从光标到行尾的部分
CTRL u : 删除从光标到行首的部分
ALT d : 删除从光标到当前单词结尾的部分
CTRL w : 删除从光标到当前单词开头的部分
CTRL a : 将光标移到行首
CTRL e : 将光标移到行尾
ALT a : 将光标移到当前单词头部
ALT e : 将光标移到当前单词尾部
CTRL y : 插入最近删除的单词
!$ : 重复前一个命令最后的参数。
例如:您用命令 mkdir peter/pan/documents/tinkerbell 新建了一个目录,现在您向用
命令'cd'进入该目录,您可以用 cd !$,shell 将把前一个命令'mkdir'的参数添加到现在的
'cd'后面。
当您更深入了解linux后,将看到这些快捷方式在其他应用程序下输入时,有时也有效,
比如,在浏览器中的输入框中。
可用的 Shell 快捷方式
Red Hat linux 带有不少快捷方式,其中一部分是 bash 原来就有的,而还有一些则是为
您预先设置的(在后面您将看到如何设置)。
由于 home 目录是每位用户的活动中心,许多 Unix 对此有特殊的快捷方式。
'~'就是您的 home 目录的简写形式。我们假设您在其他目录, 想把一个名为'sometext'
的文件复制到您 home 目录下的 'docs'子目录中。除了输入:
cp sometext /home/myusername/docs
您还可以用简写:
cp sometext ~/docs
理论上,这也可以应用在命令'cd'上。无论当前路径在哪里,cd ~ 将回到您的home目录。
其实还可以简化,只要键入 cd ,就可以返回 home 目录了。
Red Hat linux 为您提供了一些预先设置的快捷方式(称为'别名',aliases),比如:
ll :将执行'ls -l -k'(以长格式列出目录内容,包括一些文件属性,并以 KB 而不是 byte 为单位显示文件大小)
ls :将执行'ls -F --color=auto'(列出目录内容,加上文件类型标识,并使用颜色)
现在,您应该对 shell 及一些快捷方式有了进一步的了解,下面我们来看看除了应用一些简单的命令,shell 还能作什么。
第三篇:命令的排列/命令的任务调度/命令的替换
命令的排列
现在您将看到一些常用的命令排列。您可能想在一行中给出所有命令,然后就可以把注意
力转移到其他地方。没问题,shell 允许您在不同的命令之间,放上特殊的排列字符
(queuing characters) 。这儿将介绍最常用的两种。
请注意,为了看起来更清楚,我在这些字符两旁加了空格。而在实际应用中,您不一定要
这么做,'ls -a ; du -hs'和'ls -a;du -hs'的效果是一样的。
command1 ; command2
先执行 command1 ,不管 command1 是否出错,接下来执行 command2 。
例如:
ls -a ; du -hs
将先在屏幕上列出目录中的所有内容,然后列出所有目录及其子目录所占磁盘大小。
command1 && command2
只有当 command1 正确运行完毕后,才执行 command2 。
例如:
ls -a bogusdir && du -hs
将返回 ls: bogusdir: No such file or directory , 而'du'则根本没有运行(这是因
为您没有'bogusdir'目录)。如果您将符号换成了';','du'将被执行。
为了进一步说明';'和'&&'的区别,及一般命令排列的用处,下面举一个经典的例子:linux
内核的编译和安装。
要编译、安装 linux ,您需要执行一串命令:'make dep'、'make clean'、'make bzImage'、
'make modules'、'make modules_install'和'make install'。如果要等一个命令完成后,再
输入下一个,再等,再输入,……,那就太麻烦了。另一方面,每个命令只有当前面的命令都
正确执行完毕后,才能开始执行。如果您用';'来排列命令,则即使有命令执行失败, 后面的
也照常运行,最后,您可能在'/boot'目录下得到一个有问题的内核映像(image)。而用'&&':
make dep && make clean && make bzImage && make modules && make modules_install && make install
不需要中途打断,就可以编译内核及其模块,并完成后面的安装。
命令的任务调度
当您在终端里运行一个命令或开启一个程序时,终端要等到命令或程序运行完毕后,才能
再被使用。在 Unix 中,我们称这样的命令或程序在前台(foreground)运行。如果您想在终端
下运行另一个命令,则需要再打开一个新的终端。
但这里还有一个更优雅的办法,称为任务调度(jobbing)或后台(backgrounding)。当您运
用任务的调度或将命令置于后台,终端就立即解放了,这样一来,终端立即就可以接受新的输
入。为实现这样的目的,您只需在命令后面添加一个 & :
gqview &
告诉 shell 将图片查看器'GQview'放到后台去执行(即当成 job 来运行)。
命令 jobs 将告诉您,在这个终端窗口中,运行着哪些命令与程序:
jobs
[1]+ Running gqview &
当您要关闭终端窗口时,这一点就很重要,因为关闭终端将导致所有在其中运行的任务都
将被中止,在此例中,如果您关闭了终端,由这个终端开启的 GQview 程序也将被关闭。
但如何将前台运行的一个程序放到后台去?没问题:
gqview
<CTRL z>
[2]+ Stopped gqview
bg
[2]+ gqview &
组合键 <CTRL z> 将挂起终端中正在运行的程序,然后您就可以用 bg 命令将其放到后台
去执行。
请注意,在后台运行图形应用程序有时候是有用处的,这样可以在终端下显示这个程序的
出错信息,虽然这对您可能没有直接的帮助,当如果碰到了麻烦,向别人询问时,这些出错提
示就有用武之地了。
一些图形程序,很可能还处在测试期(Beta),尽管在后台执行,也会在终端中输出一些信
息。如果您对此不满,可以用下面命令:
command &>/dev/null &
这不仅将程序送到后台执行,还将其输出发到'/dev/null'文件。 '/dev/null'是系统的
"碎纸机" (shredder),所有送到那里的信息都将消失殆尽。
命令的替换
命令替换(Command substitution)是一项很实用的功能。我们假设,您想看看 XFree86
文档中的 'README.mouse'文件,但您不知道这个文件的位置。但您是位机灵的用户,已经听说
了'locate'命令,也安装了'slocate'包,您就可以用:
locate README.mouse
发现那个文件在'/usr/X11R6/lib/X11/doc'。现在您就可以在终端里用'less'或在文件管
理器中进入那个目录然后读取文件。而命令替换可以给您带来一些便捷:
less $(locate README.mouse)
一步到位。命令'locate README.mouse'的输出(= /usr/X11R6/lib/X11/doc/README.mouse)
作为'less'的参数,然后就可以显示文件内容了。
这种机制的语法是:
command1 $(command2)
除了'$( )',您还可以用后引号(backquote):
command1 `command2`
这样虽然可以减少输入,但可读性差,而且很容易就和没有替换功能的一般单引号混淆。
这里有另外一个例子。我们假设,您打算结束一个名为'rob'的程序。您先得用命令
'pidof'找出相应的进程号(Process ID),然后以这个 PID 为参数,运行'kill'命令,这样就
可以结束'rob'程序。除了用:
pidof rob
567
kill 567
您还可以试试:
kill `pidof rob`
怎么样,效率有所提高吧?
在下一篇中,我将接着介绍 shell 的另外两种实用的机制:文件名匹配、输出重定向。
第四篇:文件名匹配/输出重定向
文件名匹配
文件名匹配使得您不必一一写出名称,就可以指定多个文件。您将用到一些特殊的字符,
称为通配符(wildcards)。
假设您想用'rm'命令删除目录下所有以字符串'.bak'结尾的文件。除了在'rm'后跟上所
有文件名作为参数,您还可以用通配符'*':
rm *.bak
'*'可匹配一个或多个字符。在本例中, 您告诉 shell 将命令'rm'的参数扩展到"所有以
'*.bak'结尾的文件",shell 就将扩展后的参数告诉'rm'命令。
您将看到,shell 在命令执行前,就将读取并解释命令行。正是因为这个,您才可以将通
配符用于 shell 命令的参数中。
让我们更进一步来认识通配符'*'。假定您有个目录,其中含文件'124.bak'、'346.bak'
及'583.bak'。您想只保留文件'583.bak',可以用:
rm *4*.bak
shell 就将'*4*.bak'扩展成"所有含'4'并以'.bak'结尾的字符串"。
注意到 rm 4*.bak 无法工作,因为这匹配的是以'4'开头的文件。由于目录中没有这样的
文件,shell 将这个模式扩展为空的字符串,故'rm'将返回出错信息:
rm: cannot remove `4*.bak': No such file or directory
如果您想保留文件'346.bak',而删除'124.bak'和'583.bak'。这看起来有些难度, 因为
被删文件的名称除了后缀其他都不同。但幸运的是,您可以用不含有来指定文件:
rm *[!6].bak
这将被读为:除了以'6.bak'结尾的文件,删除其他所有以'.bak'结尾的文件。 您必须将
取反号(negation sign)与取反字符(这里是 6)放到括号中,不然的话,shell 会将惊叹号
(exclamation mark)解释成历史记录替换的开始(the beginning of a history substitution)。
取反号在本篇介绍的所有匹配模式中都有效。
请注意:通配符'*'与取反号连用,很容易产生问题。猜猜
rm *[!6]*.bak
表示什么?这个命令将删除所有文件,甚至包括名称中包含'6'的文件。如果您将通配符
'*'放到了取反号前面和后面,实际上取反号将失效,因为 shell 将其解释为"所有名称中任
何位置都不含该字符的文件"。在我们的例子里,只有文件'666.bak'不符合该模式。
第二个通配符是问号(question mark):'?'。在匹配时,一个问号只能代表一个字符。为
了示范其用途,我们在上例的假设中添加两个新文件:'311.bak~'和'some.text'。现在, 列
出所有在点号后有四个字符的文件:
ls *.????
问号通配符能够有效地避免上面提到的'取反号陷阱'(negation trap):
rm *[!4]?.*
将扩展成"所有除了点号前倒数第二个字符为'4'的文件",也就是只保留文件'346.bak'。
您可能会问,有没有其他匹配方式?到目前为止,您只看到了在指定位置匹配唯一字符的
方法。但其实您也可以这样:
ls [13]*
将列出所有以字符'1'或'3'开头的文件;在我们的例子中,文件'124.bak'、'311.bak~'
和'346.bak'匹配。注意到您必须用中括号将匹配的模式括起来,否则模式只匹配以字符串'13'
开头的文件。
接下来,您将高兴地看到还可以定义匹配的范围:
ls *[3-8]?.*
将列出所有点号前倒数第二个字符落在'3'到'8'范围的文件。在我们的例子中,匹配的文
件是'346.bak'和'583.bak'。
引用 shell 的特殊字符
但是,上面的那些机制存在一个缺点:shell 总在命令执行前,试着进行扩展。有时候,
会变得很棘手:
文件名包含特殊字符。
假设您在那个目录中还有一个名为'!56.bak'的文件。下面试图进行模式匹配:
rm !*
rm
rm: too few arguments
shell 将'!*'解释成历史记录的替换(加入前一个命令的所有参数),而不是匹配方式。
命令本身带特殊字符作参数。
一些 linux 下的命令行工具,比如 (e)grep、sed、awk、find 及 locate ,都使用自己
的正则表达式(regular expressions)。这些表达式与模式匹配看起来惊人地相似, 但在某些
地方又有所不同。
但为了使这些特殊命令生效,shell 就不能先将其当作模式匹配来解释:
find . -name [1-9]* -print
find: paths must precede expression
应该是:
find . -name '[1-9]*' -print
./346.bak
./124.bak
./583.bak
./311.bak~
您可以通过反斜线(back slash)来引用特殊字符,比如 ! 、$ 、? 或空格:
ls !*
!56.bak
或者用(单)引号:
ls '!'*
!56.bak
请注意,要看清楚引号应该放在什么位置。命令 ls '!*' 将查找名为'!*'的文件, 这是
由于通配符也在引号间,所以只能依照字面来解释。
输出重定向
Unix 的理念是汇集许多小程序,每个东东都有特殊的专长。 复杂的任务不是由大型软件
完成,而是运用 shell 的机制,组合许多小程序共同完成。重定向就在其中发挥着重要的作用。
在多个命令间重定向
这要通过管道(pipe),由管道符号|来标识。语法是:
command1 | command2 | command3 等等
这种格式您一定已经见到过了。管道经常将一个程序的输出送到'more'或'less'来阅读。
ls -l | less
其中,第一个命令提供目录内容,第二个则将其以翻页的方式显示。更复杂的例子如:
rpm -qa | grep ^x | less
第一个命令给出所有已安装的 RPM 包,第二个则将其过滤(filter:'grep'),只剩下以
'^x'开头的包,第三个命令则将结果以翻页的方式显示。
重定向至文件
有时,您希望将命令的输出结果保存到文件中,或以文件内容作为命令的参数。这可以通
过'>'和'<'来实现。
command > file
将 command 的输出保存到 file 中,这将覆盖 file 中的内容:
ls > dirlist
将当前目录的内容保存到'dirlist'文件。
command < file
将 file 内容作为 command 的输入:
sort < dirlist > sdirlist
将文件'dirlist'的内容送到命令'sort',然后再将排序后的结果送到文件'sdirlist'。当然,您也可以一步到位:
ls | sort > sdirlist
一种特殊的方式是'command 2> file'。这将 command 执行的出错信息送到 file 中。这个您到时候会需要……
另一种操作符是'>>',这将输出添加到已存在的文件中:
echo "string" >> file
将 string 加到文件 file 中。这是不打开文件而完成编辑的好办法!
但是,'<'和'>'操作符都有一个重要的限制:
command < file1 > file1
将删除 file1 的内容,而
command < file1 >> file1
却可以很好地工作,将加工过的 file1 内容加回到文件中。
熟知了许多 shell 的机制后, 您可能急着想知道如何来定制环境。在后面的两篇中,您
将得到这方面的启示。在最后一篇中,还有一段如何处理 shell 出错信息的常见问答(FAQ),
及一些配置技巧。
第五篇:bash 配置文件/提示符/改变 $PATH
bash 配置文件
在您的 home 目录下,运行
ls .bash*
您将看到这些文件:
.bash_history :记录了您以前输入的命令,
.bash_logout :当您退出 shell 时,要执行的命令,
.bash_profile :当您登入 shell 时,要执行的命令,
.bashrc :每次打开新的 shell 时,要执行的命令。
请注意后两个的区别:'.bash_profile'只在会话开始时被读取一次,而'.bashrc'则每次
打开新的终端(如新的 xterm 窗口)时,都要被读取。按照传统,您得将定义的变量,如
PATH ,放到'.bash_profile'中,而象 aliases(别名)和函数之类,则放在'.bashrc'。 但
由于'.bash_profile'经常被设置成先读取'.bashrc'的内容,您如果图省事的话,就把所有配
置都放进'.bashrc'。
这些文件是每一位用户的设置。系统级的设置存储在'/etc/profile'、'/etc/bashrc' 及
目录'/etc/profile.d'下的文件中。但您得习惯用各自的配置文件:编辑不需要'root'权限,
还可以使您的设置更有个性。当系统级与用户级的设置发生冲突时,将采用用户的设置。
提示符
每次当您打开一个控制台(console)或 xterm 时,最先看到的就是提示符(prompt),类似于:
account@hostname ~ $
在默认设置下,提示符将显示您的用户名、主机名(默认是'localhost')、当前所在目录
(在 Unix 中,'~'表示您的 home 目录)。
按照传统,最后一个字符可以标识您是普通用户($),还是'root'(#)。
您可以通过 $PS1 变量来设置提示符。命令
echo $PS1
将显示当前的设定。其中可用字符的含义在 man bash 的'PROMPTING'部分有说明。
如何才能完成理想的设置呢?对于健忘的初学者来讲,默认设定有些不友好,因为提示符
只显示当前目录的最后一部分。如果您看到象这样的提示符
tom@localhost bin $
您的当前目录可能是'/bin'、'/usr/bin'、'/usr/local/bin'及'/usr/X11R6/bin'。当然,
您可以用
pwd (输出当前目录,print working directory)
能不能叫 shell 自动告诉您当前目录呢?
当然可以。这里我将提到的设定,包括提示符,大都包含在文件'/etc/bashrc'中。 您可
以通过编辑各自 home 目录下的'.bash_profile'和'.bashrc'来改变设置。
在 man bash 中的'PROMPTING'部分,对这些参数(parameter)有详细说明。您可以加入一
些小玩意,如不同格式的当前时间,命令的历史记录号,甚至不同的颜色。
在'~/.bashrc'中,我喜欢的设定是:
PS1="[