编程随记 ---- 拼包程序(三)
显然拼包程序主要考虑性能和正确性。显然正确性应该放在第一位,所以先
保证程序的正确性,再在此基础上考虑怎样提高性能。
根据上面所描述的,基本上就能把拼包程序写出来了。为每个socket保留一
个缓存区,显然每个连接应该有两个缓存区,一个方向一个。每次收到一个数据
包:
1、判断是否是现有保存的连接,是转2;否转3
2、状态为接收数据:察看其标志位,如果是SYN包,直接丢弃,如果不是,
判断其ACK号是否是当前SEQ+1,是则增加到当前缓存区内;
不是直接丢弃,如果标志位有FIN标志,则将这个连接终止。
状态为初始状态:察看其标志位,如果不是SYN-ACK包,直接丢弃;是将状态
标志为SYN_ACK
状态为SYN_ACK: 察看其标志为,判断是否是ACK包,不是,直接丢弃,是则
判读ACK是否是SEQ+1,是则状态置为接收数据。
转4
3、创建两个新的连接,一个方向一个,设置为初始状态:SYN(用来判断三次握手)
4、结束。
现在可以通过上述逻辑过程来编写代码。编写完用windump截获浏览网页的数据
包,然后用这个拼包程序解析一下,将两者结果比较一下,就能验证拼包程序的正
确性。
然后我们再来考虑一下性能方面。显然其中判断是否有现有连接部分需要妥善
处理,这是个瓶颈所在。幸好可以采用STL中的map来实现查找过程。将每个连接保
存到map中,以socket为索引。这样就可以提高效率。
显然内存是有限的,而连接是无限的,所以肯定需要对内存缓存区进行管理,
每次删除连接,建立连接会将内存缓存区中的空余位置打乱,不连续。如何快速的
在内存缓存区中找到未用空间是个小技巧。具体参见《编程心得 ---- 内存管理》
一文。
到了这一步,从MIT网上下载了几百兆的用tcpdump捕获的数据包,用来测试自
己写的拼包程序,一切OK。速度和正确性都能得到保证。可惜自以为已经解决这个
问题的我还是想的太简单了。随后老大的一番教诲使我感到一阵阵寒冷,不过那是
后话了。下次再细说。