基于Socket的聊天室实现原理
福建泉州数据通信局 林天山
(lts@www.gz.fj.cn)
---- Socket聊天室基本原理是,抛开OGI和WWW服务器,根据HTML规范,接收到浏览器的请求以后,模仿WWW服务器的响应,将聊天内容发回浏览器。在浏览器看来就像浏览一个巨大的页面一样始终处于页面联接状态, 这就是一个专门的聊天服务器,一个简化了的WWW服务器。
----这样相比CGI方式来说,Socket聊天室的优点就很明显:
不需要专门的WWW服务器,在聊天服务器里完成必要的工作,避开耗时的CGI 过程。
如果使用单进程服务器,就不需要每次产生新进程。
数据交换完全在内存中进行,不用读写文件。
不需要定时刷新,减少屏幕的闪烁,减少对服务器的请求次数。
----下面我们来看看具体实现流程。
一、 聊天服务器实现流程 ----下图是服务器程序流程:
----上图中的“处理用户输入”部分可以细化为下图:
----用户数据输入都是通过URL传送,下面是几个URL实例,结合后面客户端流程,可以更好地理解系统结构。
----这是一个用户名密码均为‘aaa'的聊天用户登录系统,说了一句话“hello”,然后退出所产生的一系列请求,其中密码用系统函数crypt加密过: /login?name=aaa&passwd=PjHIIEleipsEE
/chat?sid=ZUyPHh3TWhENKsICnjOv&passwd=PjHIIEleipsEE
/talk?sid=ZUyPHh3TWhENKsICnjOv&passwd=PjHIIEleipsEE
/names?sid=ZUyPHh3TWhENKsICnjOv
/doTalk?sid=ZUyPHh3TWhENKsICnjOv
&passwd=PjHIIEleipsEE&message=hello
/leave?sid=ZUyPHh3TWhENKsICnjOv&passwd=PjHIIEleipsEE
二、 客户端具体登录过程 ---- 我们先看看聊天界面:
----聊天界面由三个frame组成,其中chat帧是聊天内容显示部分,talk帧是用户输入部分,包括聊天内容输入、动作、过滤以及管理功能都在这一帧输入,names是在线名单显示部分,这一部分是定时刷新的。
---- 让我们从浏览器的角度来看看进入聊天室的过程。
---- 1.首先浏览器请求页面:
---- http://host:9148/login?name=NAME&passwd=PWD
---- 此时产生了一个连接到服务器聊天端口的Socket联接,并发送了一行数据:
---- GET /login?name=NAME&passwd=PWD HTTP/1.1
----2.服务器生成一个session ID,验证密码以后,发回: HTTP/1.1 200 OK
<其他头信息>
Content-TYPE: text/html
<空行>
……
……
----然后服务器关闭Socket联接。
----3.浏览器收到以上html文件后,将会依次打开三个联接(其中的$sid和$encrypt_pass是变量): /chat?sid=$sid&passwd=$encrypt_pass
/talk?sid=$sid&passwd=$encrypt_pass
/names?sid=$sid
----这三个联接中的第一个联接chat在整个聊天过程中都是保持联接的,这样从浏览器角度来看,就是一个始终下载不完的大页面,显示效果上就是聊天内容不是靠刷新来更新,而是不断地向上滚动。通过察看html代码可以看到,只有< html >< body >,然后就是不断增加的聊天内容,没有< /body >< /html >。
---- 另外两个联接在页面发送完毕以后,Socket就关闭了。
---- 这样一次登录聊天室实际上有四次Socket联接,但登录完成以后,只有chat帧的Socket是保持联接的,用于接收来自服务器的聊天信息,这是 Socket聊天室的关键所在。
----在服务器端储存了所有参加聊天的客户的chat Socket,当有人发言时,服务器就向所有chat Socket发送聊天内容。
---- Talk与names帧的html实际上和普通的form是一样的。
---- 4.在用户登录以后,服务器端保存了一张包括用户信息的表格:
---- 在perl实现中,我们使用哈希结构储存信息,以session ID 作为key索引。这样的存储结构便于存取数据,回收空间。每个客户信息是一个数组: [socket,name,passwd,privilige,filter,login_time,color]
socket:储存chat帧socket联接
name:用户名
passwd:密码
privilige:权限
filter:某个用户的过滤列表的引用(reference)
login_time:记录登录时间,以便以后清除一些超时联接
color:用户聊天颜色
----以上用户数据大部分是在login阶段,用户通过密码验证以后填入的。只有chat Socket要等到chat帧显示以后才得到。如果超过一定时间,Socket 还是没有填入,说明浏览器取得主框架以后连接中断了,这时候就需要删除该用户数据。
---- 以上是聊天室核心部分,其他部分,如用户注册、改密码等可以沿用CGI聊天室代码。
三、 需要改进的地方 ---- 目前提供了聊天、悄悄话、动作这些基本聊天功能以及过滤用户名单这样的附加功能。管理功能完成了踢人、查IP、任命室主。今后需要改进的地方有:
----稳定性:目前聊天室还没有经过大用户量测试,稳定性还不能充分保证。由于是单进程循环服务器,某个用户通信死锁将导致所有人死锁。如果采用并发多进程服务器,可以使稳定性得到提高。但这样的系统对服务器资源消耗也会大许多。
---- 功能:自建聊天室等功能还没有完成,这些外围功能在稳定性有保证以后就可以比较容易地加入。