完成端口模式
完成端口是到目前为止最为复杂的输入输出模式。然而,当一个应用不得不同时处理大量的socket时,它也提供了使系统性能达到最佳的可能性。不幸的是,完成端口只能用在windows NT和windows2000上。由于完成端口被设计得极为复杂,它应该成为程序员的青年禁卫军,只有在被迫面对几百甚至几千个并发的socket、你又希望在添加CPU后可以获得更好的scale时,才被派上战场。关于完成端口,最重要的是记住这一点:如果你为winnt/2000开发处理大量socket I/O 请求的高性能服务,它是你的最佳选择(比如,Web服务)。
本质上完成端口模式要求你创建一个win32完成端口对象来管理重叠i/o请求,用一定数量的线程来处理已完成的重叠i/o请求.注意,事实上完成端口是win32,winnt,win2000的内建的,它能操作的不仅仅是socket句柄。但是,本章将把讨论范围局限于在socket句柄上下文中,如何利用完成端口的优势。
在开始使用完成端口模式之前,我们必须创建一个完成端口对象,用它来管理任意数量的socket句柄上的多I/O请求。完成这一动作需要调用CreateIoCompletionPort函数,它具有如下形式的定义:
HANDLE CreateIoCompletionPort(
HANDLE FileHandle,
HANDLE ExistingCompletionPort,
DWORD CompletionKey,
DWORD NumberOfConcurrentThreads
);
在了解参数的细节之前,要明白这个函数事实上有两个目的:
。创建一个完成端口对象
。把一个句柄关联到完成对口上。
开始创建完成端口时,我们唯一感兴趣的参数是NumberOfConcurrentThreads,前面的三个参数可以忽略不计。参数NumberOfConcurrentThreads用来指定在一个完成端口上可以并发的线程数量。理想的情况是,一个处理器上只运行一个线程,这样可以避免线程上下文切换的开销。如果这个参数的值为0,那就是告诉系统线程数与处理器数相同。我们可以用下面的代码来创建I/O完成端口。
CompletionPort = CreateIoCompletionPort(INVALID_HANDLE_VALUE,
NULL, 0, 0);
这段代码返回一个句柄,在关联socket句柄时,它用来标识这里的完成端口。
工作者线程和完成端口
成功的创建了完成端口对象,就可以把socket句柄(注意,原文用的是handles,复数)关联上去。可是在做这一步之前,还有一件必须完成的工作:创建一个或多个工作者线程,当socketI/O 请求被投递到完成端口对象时,这些线程为完成端口服务。说到这里,你可能想知道应该创建多少个线程来为完成端口服务。事实上这是完成端口模式更为复杂的一面,因为这需要你通盘考虑整个应用的设计,才能决定用多少个线程来为I/O请求服务。注意到这一点是很重要的:在调用CreateIoCompletionPort时指定的并发线程的个数,和创建的工作者线程的个数是有区别的,
或者说,它们不是一回事。我们在前面推荐的做法,是调用CreateIoCompletionPort时指定每个处理器上只有一个线程,以避免线程上下文切换的开销。CreateIoCompletionPort的参数NumberOfConcurrentThreads明确的告诉系统,每次只允许n个线程可以操作完成端口。如果你为一个完成端口创建的工作者线程比n多,那一次只能有n个线程可以进行操作(确切地说,在一小段时间内,系统激活的线程有可能超过n,但系统会很快将这个数量减小到n)。你可能会觉得奇怪:我明明已经在CreateIoCompletionPort中指定了一个值,干吗要创建比它多的工作者线程。
正如我前面提到的,这取决于你的整个应用的设计。如果一个工作者线程调用sleep、WaitForSingleObject之类的函数,然后,它挂了,另一个线程就可以取代它的位置。或者说,你总是希望有足够多可以执行的线程,来满足你在CreateIoCompletionPort指定的那一个数字。这样,如果你预见到工作者线程可能阻塞,你就找到了一个理由,来创建比CreateIoCompletionPort的参数NumberOfConcurrentThreads多的工作者线程。