了解 UNIX 的多任务原理
在 UNIX 系统中,每个系统和最终用户任务都包含在某个进程中。系统总是不断地创建新的进程,当任务结束或意外发生时,进程会终止。在本文中,您将了解如何控制进程和使用一些命令来查看您的系统。
在 最近的街头游乐会上,有一个单人乐队让我很是着迷。的确,这让我很开心,还给我留下了深刻印象。这个单人乐队的唯一成员利用嘴、大腿、膝盖和脚分别控制口 琴、五弦琴、钹和脚鼓,生动地演奏了齐柏林飞船乐队的《天堂的阶梯》,他演奏的贝多芬《第五交响曲》也颇为动人。和他相比,我能一边拍脑袋一边摸肚子就觉 得很不错了。(或者是一边拍肚子一边摸脑袋。)
对您来说,幸运的是,UNIX 操作系统更像是那个单人乐队,而不是像我这个笨手笨脚的专栏作家。UNIX 特别擅长同时处理多个任务,并安排它们访问系统中的有限资源(内存、设备和 CPU)。打个比方,UNIX 可以一边散步,一边嚼口香糖。
这个月我们研究的内容要比平常更深入一些,我们会看看 UNIX 是如何同时做这么多事的。这次我们还会探索 shell 的内部,了解工作控制命令,如 Ctrl+C(终止)和 Ctrl+Z(挂起)是怎样实现的。
一个真正的多任务系统
在 UNIX(以及大多数现代操作系统,包括 Microsoft Windows、Mac OS X、FreeBSD 和 Linux)中,每个计算任务都是由一个进程表示的。UNIX 似乎能同时运行很多任务,这是因为每个进程都会轮流(从概念上来讲)分到一小片 CPU 时间。
一个进程就像一个容器,它与某个正在运行的应用程序、环境变量、应用程序的输入和输出,以及进程的状态(包括其优先级和累计资源使用情况)捆绑在一起。
为了便于理解,您可以把一个进程想像成一个独立的国家,有边界、资源,还有国民生产总值。
每个进程还有一个所有者。一般来说,您启动的任务(如您的 shell 和命令)的所有者就是您。系统服务的所有者可能是特殊用户或超级用户 root。例如,为了增强安全性,Apache HTTP Server 的所有者一般是一个名为 www 的专用用户,该用户能提供 Web 服务器所需的的文件访问权限,但不包含其他权限。
进程的所有权可能会改变,但必须严格保持其独占性。一个进程在任何时候都只能有一个所有者。
最后,每个进程都具有权限。一般来说,进程的权限与其所有者的权限是相称的。(例如,如果您无法在命令行 Shell 中访问某个特定文件,则您从 Shell 中启动的程序也会继承同样的限制。)这一继承规则有一个例外情况,即应用程序启用了特殊的 setuid 或 setgid 位,如 ls 显示的那样,在此情况下,某个进程可能会获得比其所有者更高的权限。
setuid 位可以使用 chmod u+s 进行设置。setuid 的权限如下所示:
$ ls -l /usr/bin/top
-rwsr-xr-x 1 root wheel 83088 Mar 20 2005 top
setgid 位可以使用 chmod g+s 设置:
$ ls -l /usr/bin/top
-r-xr-sr-x 1 root tty 19388 Mar 20 2005 /usr/bin/wall
一个 setuid 进程(如启动 top)是用拥有该文件的用户权限运行的。因此,当您运行 top 时,您的权限会被提升,与 root 的权限等同。类似地,一个 setgid 进程是用与文件的组所有者相关联的权限运行的。
例如,在 Mac OS X 中,wall 工具(“write all”的缩写,因其会将某个消息写入所有物理或虚拟终端设备而得名)的 setgid 被设为tty(如上所示)。当您登录并分配到一个用来键入的终端设备(该终端成为 Shell 的标准输入)时,您将被指定为该设备的所有者,而 tty 成为组所有者。因为 wall 是以组 tty 的权限运行的,所以它可以打开和写入所有终端。
获取列表
就像所有其他系统资源一样,您的 UNIX 有一个有限但十分庞大的进程池(实际上,系统中的进程几乎用之不尽)。每个新任务(如启动 vi 或运行 xclock)都会立即从池中分配到一个进程。在 UNIX 系统中,您可以使用 ps 命令,查看一个或多个进程。
例如,如果您想查看您拥有的所有进程,键入 ps -w --user username : $ ps -w --user mstreicher
您可以使用 ps -a -w -x 查看完整的进程列表。(ps 命令的格式和特定的标志随各个 UNIX 版本而有所差异。请参阅系统的联机文档,以查找具体的说明。) -a 是选择 tty 设备上运行的所有进程;-x 则可进一步选择与 tty 无关的所有进程,通常包括所有的永久系统服务,如 Apache HTTP server、cron 工作调度程序等等;-w 则以加宽的格式显示内容,在查看命令行或与每个进程相关的应用程序完整路径名时很有用。
ps 具有丰富的功能,某些版本的 ps 甚至允许您自定义输出。例如,下面就是一个有用的自定义进程列表:
$ ps --user mstreicher -o pid,uname,command,state,stime,time
PID USER COMMAND S STIME TIME
14138 mstreic sshd: mstreicher S 09:57 00:00:00
14139 mstreic -bash S 09:57 00:00:00
14937 mstreic ps --user mstrei R 10:23 00:00:00
-o 根据各列名称的顺序对输出进行格式化。pid、uname 和 command 分别指进程 ID、用户名和命令。state 代表进程的状态,如正在睡眠 (S) 或运行 (R)。(稍后将对进程状态进行更详细的说明。)stime 显示命令的开始时间,time 则显示该进程占用了多少 CPU 时间。
进程从哪里来?
在 UNIX 中,某些进程会从系统启动到关机的时间里一直运行,但大多数进程都会随任务的开始和完成而迅速地出现和消失。有时,某个进程可能会“早夭“,甚至会“暴死”(比如在系统崩溃时)。新的进程是从哪里来的呢?
每个新的 UNIX 进程都是某个现有进程的产物。另外,每个新进程(不妨将其称为“子”进程)是对“父”进程的克隆体(至少有一瞬间是如此),直到“子”进程继续独立执行为 止。(如果每个进程都是某个现有进程的后代,那么不免会有一个疑问:“第一个进程是从哪里来的?”请参阅下面的侧栏以寻找答案。)
----------------------------------------------
鸡和蛋
某些争论是经久不息的:生存还是毁灭?可口可乐还是百事可乐?PC 还是 Mac?当然,还有一个古老的悖论,“鸡生蛋,还是蛋生鸡?”
如果每个新的 UNIX 进程都是某个现有的、正在运行的进程的后代,那么第一个进程是从哪里来的?答案是:UNIX 内核在系统启动序列中产生了第一个进程。
第一个进程被恰如其分地称为 init,所有其他系统进程的亲缘关系最终都可以追溯到 init。实际上,init 的进程编号是 1。如果您要查看 init 的状态,可键入 ps -l 1:
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
4 S 0 1 0 0 68 0 - 373 select ? 0:02 init [2]
正如您所看到的,init 的所有者 (UID) 是 0 (root)。和系统中所有其他进程不同的是,init 没有父进程,它的父进程 ID (PPID) 为 0。