与Unix的亲密接触8--UNIX 进程

了解 UNIX 的多任务原理

在 UNIX 系统中，每个系统和最终用户任务都包含在某个进程中。系统总是不断地创建新的进程，当任务结束或意外发生时，进程会终止。在本文中，您将了解如何控制进程和使用一些命令来查看您的系统。

在最近的街头游乐会上，有一个单人乐队让我很是着迷。的确，这让我很开心，还给我留下了深刻印象。这个单人乐队的唯一成员利用嘴、大腿、膝盖和脚分别控制口琴、五弦琴、钹和脚鼓，生动地演奏了齐柏林飞船乐队的《天堂的阶梯》，他演奏的贝多芬《第五交响曲》也颇为动人。和他相比，我能一边拍脑袋一边摸肚子就觉得很不错了。（或者是一边拍肚子一边摸脑袋。）

对您来说，幸运的是，UNIX 操作系统更像是那个单人乐队，而不是像我这个笨手笨脚的专栏作家。UNIX 特别擅长同时处理多个任务，并安排它们访问系统中的有限资源（内存、设备和 CPU）。打个比方，UNIX 可以一边散步，一边嚼口香糖。

这个月我们研究的内容要比平常更深入一些，我们会看看 UNIX 是如何同时做这么多事的。这次我们还会探索 shell 的内部，了解工作控制命令，如 Ctrl+C（终止）和 Ctrl+Z（挂起）是怎样实现的。

一个真正的多任务系统

在 UNIX（以及大多数现代操作系统，包括 Microsoft Windows、Mac OS X、FreeBSD 和 Linux）中，每个计算任务都是由一个进程表示的。UNIX 似乎能同时运行很多任务，这是因为每个进程都会轮流（从概念上来讲）分到一小片 CPU 时间。

一个进程就像一个容器，它与某个正在运行的应用程序、环境变量、应用程序的输入和输出，以及进程的状态（包括其优先级和累计资源使用情况）捆绑在一起。

为了便于理解，您可以把一个进程想像成一个独立的国家，有边界、资源，还有国民生产总值。

每个进程还有一个所有者。一般来说，您启动的任务（如您的 shell 和命令）的所有者就是您。系统服务的所有者可能是特殊用户或超级用户 root。例如，为了增强安全性，Apache HTTP Server 的所有者一般是一个名为 www 的专用用户，该用户能提供 Web 服务器所需的的文件访问权限，但不包含其他权限。

进程的所有权可能会改变，但必须严格保持其独占性。一个进程在任何时候都只能有一个所有者。

最后，每个进程都具有权限。一般来说，进程的权限与其所有者的权限是相称的。（例如，如果您无法在命令行 Shell 中访问某个特定文件，则您从 Shell 中启动的程序也会继承同样的限制。）这一继承规则有一个例外情况，即应用程序启用了特殊的 setuid 或 setgid 位，如 ls 显示的那样，在此情况下，某个进程可能会获得比其所有者更高的权限。

setuid 位可以使用 chmod u+s 进行设置。setuid 的权限如下所示：

$ ls -l /usr/bin/top

-rwsr-xr-x 1 root wheel 83088 Mar 20 2005 top

setgid 位可以使用 chmod g+s 设置：

$ ls -l /usr/bin/top

-r-xr-sr-x 1 root tty 19388 Mar 20 2005 /usr/bin/wall

一个 setuid 进程（如启动 top）是用拥有该文件的用户权限运行的。因此，当您运行 top 时，您的权限会被提升，与 root 的权限等同。类似地，一个 setgid 进程是用与文件的组所有者相关联的权限运行的。

例如，在 Mac OS X 中，wall 工具（“write all”的缩写，因其会将某个消息写入所有物理或虚拟终端设备而得名）的 setgid 被设为tty（如上所示）。当您登录并分配到一个用来键入的终端设备（该终端成为 Shell 的标准输入）时，您将被指定为该设备的所有者，而 tty 成为组所有者。因为 wall 是以组 tty 的权限运行的，所以它可以打开和写入所有终端。

获取列表

就像所有其他系统资源一样，您的 UNIX 有一个有限但十分庞大的进程池（实际上，系统中的进程几乎用之不尽）。每个新任务（如启动 vi 或运行 xclock）都会立即从池中分配到一个进程。在 UNIX 系统中，您可以使用 ps 命令，查看一个或多个进程。

例如，如果您想查看您拥有的所有进程，键入 ps -w --user username ： $ ps -w --user mstreicher

您可以使用 ps -a -w -x 查看完整的进程列表。（ps 命令的格式和特定的标志随各个 UNIX 版本而有所差异。请参阅系统的联机文档，以查找具体的说明。） -a 是选择 tty 设备上运行的所有进程；-x 则可进一步选择与 tty 无关的所有进程，通常包括所有的永久系统服务，如 Apache HTTP server、cron 工作调度程序等等；-w 则以加宽的格式显示内容，在查看命令行或与每个进程相关的应用程序完整路径名时很有用。

ps 具有丰富的功能，某些版本的 ps 甚至允许您自定义输出。例如，下面就是一个有用的自定义进程列表：

$ ps --user mstreicher -o pid,uname,command,state,stime,time

PID USER COMMAND S STIME TIME

14138 mstreic sshd: mstreicher S 09:57 00:00:00

14139 mstreic -bash S 09:57 00:00:00

14937 mstreic ps --user mstrei R 10:23 00:00:00

-o 根据各列名称的顺序对输出进行格式化。pid、uname 和 command 分别指进程 ID、用户名和命令。state 代表进程的状态，如正在睡眠 (S) 或运行 (R)。（稍后将对进程状态进行更详细的说明。）stime 显示命令的开始时间，time 则显示该进程占用了多少 CPU 时间。

进程从哪里来？

在 UNIX 中，某些进程会从系统启动到关机的时间里一直运行，但大多数进程都会随任务的开始和完成而迅速地出现和消失。有时，某个进程可能会“早夭“，甚至会“暴死”（比如在系统崩溃时）。新的进程是从哪里来的呢？

每个新的 UNIX 进程都是某个现有进程的产物。另外，每个新进程（不妨将其称为“子”进程）是对“父”进程的克隆体（至少有一瞬间是如此），直到“子”进程继续独立执行为止。（如果每个进程都是某个现有进程的后代，那么不免会有一个疑问：“第一个进程是从哪里来的？”请参阅下面的侧栏以寻找答案。）

----------------------------------------------

鸡和蛋

某些争论是经久不息的：生存还是毁灭？可口可乐还是百事可乐？PC 还是 Mac？当然，还有一个古老的悖论，“鸡生蛋，还是蛋生鸡？”

如果每个新的 UNIX 进程都是某个现有的、正在运行的进程的后代，那么第一个进程是从哪里来的？答案是：UNIX 内核在系统启动序列中产生了第一个进程。

第一个进程被恰如其分地称为 init，所有其他系统进程的亲缘关系最终都可以追溯到 init。实际上，init 的进程编号是 1。如果您要查看 init 的状态，可键入 ps -l 1：

F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD

4 S 0 1 0 0 68 0 - 373 select ? 0:02 init [2]

正如您所看到的，init 的所有者 (UID) 是 0 (root)。和系统中所有其他进程不同的是，init 没有父进程，它的父进程 ID (PPID) 为 0。