Apache源代码全景分析第1卷:体系结构与核心模块
分類: 图书,计算机/网络,网络与数据通信,网络配置与管理,
作者: 张中庆,梁雪平著
出 版 社: 电子工业出版社
出版时间: 2009-5-1字数:版次: 1页数: 604印刷时间:开本: 16开印次:纸张:I S B N : 9787121084744包装: 平装编辑推荐
目前国内市面上少有的全面介绍Apache体系结构与核心模块的专业图书。剥丝抽茧——剖析Apache系统架构与核心模块,大巧不工——重新认识开源社区集体智慧的结晶。
内容简介
本书是“Apache源代码全景分析”的第1卷。书中详细介绍了Apache的基础体系结构和核心模块的实现机制,包括配置文件、模块化结构、多任务并发,以及网络连接和请求读取,其中多任务并发体系结构是本书分析的重点,讨论了Prefork、Worker及WinNT三种MPM。本书还着重介绍了Apache 2.0新引入的过滤器,包括过滤器的使用、实现,以及其中的数据组织形式——存储段和存储段组,剖析了Apache中常用的过滤器。
本书的目的是深入挖掘Apache运行背后的实现机制和模块开发的细节,适合Apache模块开发者、希望了解内部细节的Apache管理员、Web服务器开发者、大规模服务器开发者学习和阅读。
作者简介
张中庆,计算机软件与理论硕士。拥有多年服务器端软件开发经验,关注大规模服务器设计技术,致力于开源技术的使用、分享和推广,《UNIX/Linux下curses库开发指南》第一作者。
目录
第1章Web服务器概述
1.1WWW概述
1.1.1Internet概述
1.1.2超文本的概念
1.1.3WWW的历史
1.2HTTP服务器
1.2.1 HTTP服务器简介
1.2.2 HTTP服务器功能
1.2.3 WWW文档
1.2.4工作方式
1.3Apache功能
1.3.1虚拟主机
1.3.2 内容协商
1.3.3持续连接
1.3.4缓存
1.3.5访问控制和安全
1.3.6动态内容生成
第2章 Apache体系结构
2.1 Apache目录
2.2Apache层次结构
2.2.1操作系统支持层
2.2.2可移植运行库层
2.2.3核心功能层
2.2.4可选功能层
2.2.5第三方支持库
2.2.6Apache工具包
2.3Apache核心功能层
2.3.1核心与可选模块的关系
2.3.2核心组件
2.4Apache运行流程
2.4.1 Apache启动过程
2.4.2 HTTP连接处理
2.4.3请求报文读取
2.4.4请求处理
2.4.5内容生成
2.4.6关闭与重启
2.5主程序main
2.5.1主程序概要
2.5.2主程序细节
第3章配置文件管理
3.1Apache配置系统
3.2配置文件
3.2.1配置文件类
3.2.2配置文件处理时机
3.3指令相关概念
3.3.1指令概述
3.3.2指令参数
3.3.3指令上下文
3.3.4指令参数类型
3.4指令配置
3.4.1指令结构
3.4.2指令定义
3.4.3预定义指令函数
3.4.4指令表
3.5Apache配置处理
3.5.1 指令保存
3.5.2指令读取
3.5.3配置指令处理
3.5.4特殊指令
3.6.htaccess处理
3.6.1 .htaccess使用场合
3.6.2指令的覆盖
3.6.3 处理.htaccess
3.7实现自己的配置段
第4章Apache模块化体系结构
4.1Apache模块概述
4.1.1Apache模块组成
4.1.2Apache核心与模块交互
4.2Apache模块结构
4.3模块的加载
4.3.1模块变量
4.3.2DSO(Dynamic Shared Object,动态共享对象)的概念
4.3.3静态模块加载
4.3.4动态模块加载
4.3.5模块卸载
4.4指令表
4.4.1指令表概述
4.4.2指令处理函数
4.4.3指令共享
4.5挂钩(HOOK)
4.5.1为什么引入挂钩
4.5.2 声明挂钩
4.5.3挂钩数组声明(APR—HOOK—LINK)
4.5.4挂钩结构(APR—HOOK—STRUCT)
4.5.5挂钩函数注册(APR—IMPLEMENT—EXTERNAL—HOOK—BASE)
4.5.6使用挂钩
4.5.7挂钩排序
4.5.8可选挂钩
4.5.9挂钩纵览
4.5.10自己编写挂钩
4.6模块与配置文件
4.6.1概述
4.6.2如何描述配置信息
4.6.3 目录相关配置(Per—Directory Config)
4.6.4服务器配置(Per-Server Config)
4.7配置存储和使用
4.7.1配置向量
4.7.2配置存储体系结构
4.7.3虚拟主机配置存储
4.7.4目录配置存储
4.7.5Location配置存储
4.7.6文件配置存储
4.7.7总体存储示意
4.8模块通信
4.8.1简单通信方式
4.8.2可选函数
4.8.3提供者API
4.9常用模块
4.9.1缓存模块
4.9.2URL映射模块
4.9.3 内容生成模块
4.9.4安全模块
4.9.5代理模块
4.9.6其余模块
第5章多任务并发处理
5.1多进程并发处理
5.1.1概述
5.1.2MPM在Apache中的位置
5.2MPM数据结构
5.2.1 记分板
5.2.2终止管道(Pipe of Death)
5.3Inetd:通用的多任务处理结构
5.3.1服务器程序概述
5.3.2INETD
5.4预创建(Prefork)MPM分析
5.4.1 Leader/Follow模式
5.4.2 Prefork MPM概述
5.4.3 Prefork MPM实现
5.5工作者(Worker):MPM分析
5.5.1 Worker MPM概述
5.5.2 Worker主进程
5.5.3子进程管理
5.5.4线程管理
5.5.5信号处理
5.6WinNT MPM分析
5.6.1 WinNT MPM概述
5.6.2 完成端口相关概念
5.6.3 WinNT MPM主程序
5.6.4 监控主进程
5.6.5工作进程
5.6.6 线程处理
第6章 网络连接
6.1 网络连接概述
6.1.1 网络连接上下文环境
6.1.2等待连接
6.1.3接受连接
6.1.4创建连接
6.2连接数据结构
6.3等待连接
6.3.1概述
6.3.2套接字创建
6.3.3套接字侦听
6.4连接处理
6.4.1连接处理概述
6.4.2创建连接
6.4.3连接处理
6.5请求读取
6.5.1请求读取概述
6.5.2 HTTP请求报文
6.5.3 request_rec结构
6.5.4 请求读取实现
6.5.5 请求行读取
6.5.6请求头读取
6.5.7网络IO读写
第7章过滤器
7.1过滤器概述
7.2过滤器类型
7.3过滤器结构
7.4过滤器协议
7.5过滤器使用
7.5.1静态过滤器使用
7.5.2动态过滤器使用
7.6过滤器操作
7.6.1过滤器注册概述
7.6.2数据结构描述
7.6.3过滤器结点
7.6.4过滤器注册
7.6.5过滤器的查找
7.6.6添加过滤器至指定请求或连接
7.6.7从连接中删除过滤器
7.6.8过滤器初始化
7.7智能过滤器
7.7.1何谓智能过滤器
7.7.2智能过滤器的使用
7.7.3智能过滤器的实现
7.8过滤器函数
7.8.1输出过滤器
7.8.2输入过滤器
第8章存储段和存储段组
8.1什么是存储段和存储段组
8.1.1存储段和存储段组
8.1.2为什么需要存储段组
8.2存储段分配子
8.2.1概述
8.2.2分配子创建
8.2.3存储段内存分配
8.2.4存储段内存释放
8.3存储段操作概述
8.3.1存储段接口
8.3.2存储段空接口
8.4存储段类型
8.4.1堆存储段(Heap Bucket)
8.4.2内存池存储段(Pool Bucket)
8.4.3文件存储段(File Bucket)
8.4.4MMAP存储段(MMAP Bucket)
8.4.5套接字存储段(Socket Bucket)
8.4.6管道存储段(Pipe Bucket)
8.4.7持久存储段(Immortal Bucket)
8.4.8临时存储段(Transient Bucket)
8.4.9刷新存储段(Flush Bucket)
8.4.10流终止(EOS)存储段
8.4.11 HTTP错误存储段
8.5存储段操作
8.6存储段组操作
8.6.1创建存储段组
8.6.2存储段组的销毁
8.6.3存储段组的分裂
8.6.4统计存储段长度
8.6.5存储段转换
8.6.6数据写入
8.6.7ap_r函数写入
8.7存储段组和过滤器
8.7.1 存储段组和过滤器的关系
8.7.2获取存储段组
8.7.3存储段组传递
第9章常用过滤器
9.1概述
9.2输入过滤器
9.2.1 CORE_IN输入过滤器
9.2.2 HTTP_IN过滤器
9.2.3创建自己的输入过滤器
9.3输出过滤器
9.3.1资源过滤器
9.3.2 内容过滤器
9.3.3协议过滤器
9.3.4编码转换过滤器
9.3.5 网络过滤器(CORE)
9.3.6编写输出过滤器
索引
书摘插图
第1章Web服务器概述
1.3Apache功能
1.3.1 虚拟主机
虚拟主机(Virtual Host)是指在一个机器上运行多个Web站点的机制 (比如:www.companyl.com和www.company2.com)。虚拟主机的实现包括以下三种方式。
(1)Web服务器中配备多个IP地址,并且每一个逻辑Web服务器使用一个IP地址。这种虚拟主机的实现技术被称为“基于IP”,这是最简单的虚拟主机的实现机制,但是这种机制存在一些问题,比如扩展性的问题。一台机器所能存在的物理IP地址总是有限的,因此对于一个专门的ISP而言,如果要提供大量的虚拟主机,则会存在相当大的困难。另外一个存在的问题就是IP地址的有限性,目前Web站点的数目远远超过IP地址的数目,因此,以IP地址区分虚拟主机,则会使Web站点的发展受到限制。
(2)Web服务器只有一个IP地址,不同的Web服务器使用不同的端口进行侦听。因此这种服务器的请求uRI中必须明确地给出端口,而不能使用默认的Web端口80,比如http://127.0.0.1:8900。这种虚拟主机的实现技术可称为“基于端口”。这种策略存在的问题是用户必须显式给出请求的端口,这对大部分用户来说显然是不太方便的。如果忘记输入端口号或输入一个错误的端口号,则会使用错误的虚拟主机。
(3)Web服务器只有一个IP地址,同时多个域名被映射到该IP地址上。所有的Web服务器侦听同一个端口。服务器通过HTTP请求头中的HOST域对请求进行区分。对于HTTP 1.1协议而言,该域是必须具备的,而低于HTTP 1.1的协议则未必如此。因此从这个意义上说,只有HTTP 1.1协议才可以支持这种基于“HOST域”的协议。
Apache中支持上面三个方式的虚拟主机,而且通过mod_vhost_alias模块,可以使得类似的虚拟主机配置起来非常容易,减轻了管理员的负担。
……
书摘与插图