基于H.323协议的多媒体会议系统---摘录笔记
Ryan liu
2002/3/14
由ITU-T制订的基于分组交换网络(PBN)的多媒体会议系统;
这些分组网络包括LAN/WAN,Internet, Intranet以及使用PPP等分组协议通过PSTN(公共交换电话网)或ISDN的拨号连接或点对点连接。
基于IP网络的视频会议(Desktop Video Conference),是利用视频技术和IP数据通信技术通过IP网络(Internet,intranet,LAN/WAN)在两点或多个地点之间建立可视通信,实现图像、语音及数据交流的一种会议形式。
H.323会议系统的结构
传输的信息流:音频、视频、数据和控制信息。
所有的信息流采用H.225.0建议来进行打包和传送。
H.323协议定义的多媒体会议系统:
主要由终端、网守(GateKeeper,亦称网闸)、网关(Gateway)、多点控制器(MC)、多点处理器(MP)和多点控制单元(MCU)等组成。
H.323终端
在运用中,编解码器使用的音频算法是在能力交换期间通过使用H.245协商得到的。音频流应根据H.255.0标准进行格式化。H.323终端可以同时发送或接收多个音频信道信息。
视频编码不进行BCH纠错,且允许以不对称的视频比特率、帧速率、图像分辨率运行。
H.245控制信道承载管理H.323通信实体操作的端到端控制消息,包括能力交换、逻辑信道的开和关、模式选择请求、流量控制消息及通用命令和指示。
H.225呼叫控制:运用H.225.0呼叫控制信令来建立两个H.323终端间或终端与网守间的连接。呼叫信令信道的建立先于H.323终端间的H.245控制信道和其它任何逻辑信道,因此,它的建立不受H.245控制信道的管理。
RAS控制:RAS(Registration, Admission and Status, 登记、接纳和状态协议)信号运用H.225.0控制消息在终端与网守之间执行登记、接纳、带宽改变和使二者脱离关系等过程。
H.323终端的网络接口是H.225建议所描述的,它规定了下述必须的功能:
一、 对H.245控制信道、数据信道、呼叫信令信道提供可靠的端到端服务(TCP、SPX等);
二、 对于音频、视频和RAS信道提供不可靠的端到端服务(UDP、IPX等)。
这些服务可以是单工、双工、单播或多播的。
网守(网闸)
H.323网守在系统中必须提供4种基本服务:
地址翻译
带宽控制
许可控制
区管理功能。
网守的可选功能:
带宽管理、呼叫鉴权、呼叫控制信令和呼叫管理等
网关
通常网关的目的是将分组网络终端的特性映射到电路交换网络终端上或相反。网关的主要应用在于通过N-ISDN建立与远程H.320兼容终端的连接;通过B-ISDN建立与远程H.321兼容终端的连接或通过通用电话交换网或无线网络建立与远程H.324和V.70兼容终端的连接等方面。
多点控制单元(MC)
MC不直接处理媒体信息流;MP对音频、视频或数据信息进行混合、切换及其它处理。
图象编码
H.323会议系统中的图象编码主要两种:即H.261和H.263。
其是H.261 QCIF是必备的格式,除此而外,可以通过能力协商采用其它的编码形式。
H.261建议在编码方面主要采用了三种技术来实现压缩:
·预测编码
·变换域编码
·游程熵编码
同H.261一样,H.263采用了运动补偿和DCT编码方法,但它参照MPEG标准引入以I帧、P帧、PB帧(选项)三种帧模式和INTER(帧间编码)、INTRA(帧内编码)两种编码模式。
音频(语音)编码
H.323会议系统中的音频(语音)编码方式主要有六种:G.711、G.722、G.723.1、G.728、G.729和MPEG audio。其中G.711是必备的,其它为可选项。除了上述六种编码方式外,也可以通过能力协商来采用其它方法。目前,H.323会议系统中主要采用G.723.1和G.729两种语音方式。
G.723.1是一个双速率的语音编码器,它的两个编码速率分别为6.3k和5.3k。高速率(6.3k)采用多脉冲激励最大似然量化(MP_MLQ)算法,低速率(5.3k)采用代数码本激励线性预测(ACELP)算法。这两种算法具有相同的理论基础,都是基于线性预测(LPC),都采用非周期性分量的激励源。不同之处在于对MP_MLQ采用多脉冲最大似然量化激励,而对ACELP采用的是代数码本激励。
G.723.1语音质量较好。
其5.3k速率编码,语音质量优于VCELP(8kb/s);
其6.3k速率编码,语音质量等价于32kb/s的G.726建议相应指标。
两者基本上均能达到长途电话质量的要求。
G.723.1的缺点是固有时延较大。
G.729是一个8kb/s的语音编码标准,它采用的算法是共轭结构代数码本激励线性预测编码(CS_ACELP),能达到32kb/sADPCM语音质量。
CS_ACELP算法很有特点:
作不太大的改动后,向下可达6.4kb/s,向上可达13kb/s,且可传送更好的语音质量。
数据通信
会议系统中的数据通信是多个与会者之间的通信,所以是建立一个多点通信服务(MCS)的通信体系结构。数据通信对差错控制要求较高,对时延不敏感。
数据通信采用T.120系列建议,分为四个层面来完成会议系统中的数据通信:
第一个层面是下四层的通信协议栈,在T.123建议中规定。
第二个层面是多点通信服务(MCS),在T.122/T.125中规定。
第三个层面是通用会议控制(GCC),在T.124中规定。
第四个层面是应用层面,在T.121 、T.126、 T.127 和T.128中规定。其中T.126中规定的电子白板和T.127中规定的二进制文件传送已获得应用。
码流复用
H.323会议系统是基于分组交换的,因而会议系统中的码流在传输之前就必须进行打包,根据数据包上的标签进行统计复用。
音频和视频码流对实时性要求很高,故要尽可能的避免延时问题.但是,对于少量的包丢失却不太敏感。因此,对于音频和视频码流,采用实时传输协议RTP来对它们进行打包再运用面向无连接的UDP协议进行实时传输。对RAS信号也采用UDP协议来传输。
数据和控制信号对于服务质量要求很高,少量的包丢失或出错都是无法忍受的。因此对于数据和控制码流,在传输层运用面向连接、提供可靠服务的TCP协议,从而完成对它们的可靠传送。H.323系统中码流复用关系如下图所示:
QoS(服务质量)保证
多播技术能够有效地解决多点对多点数据通信的网络带宽问题。在传输过程中,根据发送和接收各方的网络拓扑分布,确定并优化数据传送的树状路径,在同一网段,相同内容的数据流只需传送一次。多播地址可以采用一个通用的多播地址,但这不是有效的通信方式,最好是能够动态地分配一组地址。
资源预留是指根据业务数据的QoS要求和带宽资源管理策略进行带宽资源分配,在IP网上提供一条完整的路径。IETF的RFC2205资源预留协议(RSVP)就是提供这种管理机制的协议。
在面向无连接的网络上,增加了面向连接的特性;它既利用了面向无连接网络的多种业务承载能力,又提供了接近面向连接网络的质量保证。
RTP为交互式音频、视频等具有实时特征的数据提供端到端的传送服务。如果底层网络支持多播,RTP还可使用多播向多个目的端点发送数据。
RTCP是RTP的控制协议,它周期性地与所有会话的参与者进行通信,并采用和传送数据包相同的机制来发送控制包。
补充:
电视质量的视频传输约为33帧/s;基于ISDN的点到点视频传输在理论上可以达到30帧/s。而桌面视频会议实际上的传输速度一般为10帧/s,如果在Internet高峰期传送或在局域网上传送大文件,速度还会降到5帧/s。
随着H.323v2和V.90等标准的制定完善,基于电话网(使用H.324标准)和基于IP网(即基于局域网,使用H.323标准)的视频会议将成为今后该领域发展的主流。