一、引言
近年来,无线通信技术的发展进入了空前活跃的阶段,音频、视频和数据的无线传输成了网络信息技术的核心。无线网络与有线网络相比成本低,随着芯片价格的下跌以及消费者对无线网络的期待,无线网络必然成功。而且,随着第三代移动通信的发展,各种不同移动业务的出现,为宽带视讯业务提供了广阔的市场前景。无线视讯业务将成为未来无线移动通信业务新的亮点。
视频通信对于我们来说并不是一个新事物,可视电话早就已经实现。但无线视讯就不这么简单了。无线网络与固定网络相比,不受时间和地点的限制,但是有更多的问题需要面对和解决。
首先,视讯业务的数据量大,受带宽的限制,对误比特率要求高。其次,无线信道具有时变、易错等特点。在无线视讯系统的实用化过程中将会面临更多的问题。因此,要实现无线视频通信,必须对视频信号和无线信道两方面提出一个高要求。
二、无线视讯给我们带来了什么
当前,用于视频信号的主要传输网络有PSTN、ISDN、广播网以及Internet。最初,视讯会议使用PSTN和ISDN传输,这两种网络的误码率都十分低。但这些并不是通过无线通信网络来进行传输的。随着无线移动设备诸如小灵通、多媒体移动电话、掌上PC的出现,无线视讯开始成为人们关注的焦点和需要。图1是一个无线视讯的典型应用场景。从一个视讯内容到一个无线终端之间的传输过程。
这里,我们可以想象,无论你处在什么地方,你都可以随时通过无线终端(诸如手机、PDA等)来收看电视节目、观看实况转播、参加会议、参与网络游戏、相互之间发送视频剪辑、进行远程监控和教学等。这些都是未来无线视讯能够带给我们的。
目前,普遍的移动通信网络诸如GPRS的数据传输速率很低,实际使用只有9.6~28.8kbit/s。无线视讯系统中即使采用了先进的视频压缩技术,图像的运动速率也只能达到1~4帧/秒,这些只是最初的无线视讯应用,其质量也仅仅比静止图像稍好。因此最初也只用于一些诸如家庭安全监控和保姆监控等。在这种情况下,无线视讯完全不能体现其真正的价值和优势。
随着移动网络技术的发展,移动网络开始从2G演变到2.5G甚至3G。一旦这些网络获得应用,高质量的无线视讯将能够实现。
三、无线视讯系统
无线视讯系统的构成必然包括视频编解码部分和无线信道两部分。但除了这两部分外还有发送和接收设备以及服务器。
1.无线视讯系统的构成
无线视讯系统的构成框图如图2所示。它由视频内容、编码器、服务器、基站和接收设备组成。
编码主要由算法结合硬件设计完成,而服务器应该具有相应的网络传输协议RTP,RSTP以确保视频流在网络中低延时传输。同时,接收设备的设计要与前面的设计兼容,不仅要具有网络协议和编解码器,还要考虑能量损耗和设备的体积,以便于携带。
在源编码后,压缩的视频流准备通过一个网络进行传输。这里往往包含一个打包过程。尤其是使用IP网络来进行传输的情况。包的正确传输需要网络提供大量的功能,诸如路由、传递、包的分离和组合、流控制等等。
在无线视讯中,可以使用IETF推荐的RTP和RTSP来完成实时数据传输。IETF是国际网络工程任务特别小组的简称(Internet Engineering Task Force),其主要目的是为基于IP的网络服务,提供所谓的推荐标准。
RTP是Real Time Protocol的简称,它以实时的方式来传送数据流,RTP使用UDP,其主要原因是,TCP是面向连接的协议,它的实时性并不好,而UDP是尽力而为的网络传输协议,适合要求传输延时小的数据。在RTP的包头有序号、时标和载荷类型比特位,RTP还使用客户程序来监视网络流量,在客户端还应该负责将数据包重新按照正确的顺序排序。
RTCP是实时的TCP,它克服了TCP实时性不好的缺点,增加了流量保护机制,确保实时数据包以尽量小的延时到达目的地。
在无线视讯系统中,端到端的传输一般在传输链的开始或者结束处包括有无线设备。所以,打包的比特流至少通过无线信道被传输一次。和有线相比,无线信道的容量会受到无线电的频率带宽和各种噪声、干扰的限制。所以无线信道可以被认为未来多媒体网络的“最弱联接”,并且尤其是当移动性导致衰落和突发错误时,更应该引起注意。引入的最终传输错误需要使用错误控制技术。其中一个技术是FEC,混合交错使用它可以减少突发错误的影响。另一个是闭循环错误控制技术像ARQ,在错误的变化范围很大时尤其有用。这些错误控制技术是信道编码的一部分。
2.无线视讯系统的特征
从以上的分析可以看出,无线视讯通信至少具有以下3个特征。
(1)高压缩率
这是从视频源来讲的,面对无线信道的带限特点,原始容量很大的视频数据必须经过压缩才能在只限于低比特速率业务的无线系统中进行传输。因此在进行传输之前必须进行高的压缩操作,并且考虑到实际的硬件实现,压缩算法必须尽量简单且保证性能。诸如MPEG-4就是一种高性能的压缩标准。
(2)高信道容错能力
与其他通信信道相比,无线信道是最为复杂的一种,再加上移动终端本身的运动,使得无线信道多变且难以控制。在无线信道中,各种问题都可能发生,信号有干扰和衰落的影响。它是一种易错、时变的系统。因此在无线视讯传输中,信道必须具有高的容错能力才能保证接收视频的质量。这一点在整个系统中尤其重要。因为易错的环境对于数字视频来说是难以忍受的,在一个视频数据流中丢失数据所产生的效果与在数字音频中遇到相似情况完全不同,在后者中可能仅仅导致一些听得见的跳跃和卡嚓声,而前者可能产生令人讨厌,而且持久的色斑并且使物体变得模糊,这将导致视频传输实际上无法广泛应用。
(3)低功率
这一点是针对于无线视讯系统的终端来讲的,因为无线视讯系统往往是便携式系统,容量的限制就需要低的功率消耗,如此才能保证整个系统的正常工作。
四、MPEG-4无线视讯系统
从以上无线视讯必须具有的条件来看,基于MPEG-4的无线视讯系统非常适合于移动多媒体的应用,因为MPEG-4具有以下几个方面的优点:(1)可以达到很高的压缩比;(2)具有灵活的编码和解码复杂性,如不同的空间分辨率、时间分辨率以及灵活的质量、性能和代价的折衷;(3)基于对象的编码方式,允许视频、音频对象的交互;(4)具有很强的容错能力。
MPEG-4按照如下5个层次组织要编码的图像,从上至下依次为:视频段(VS,Video Session)、视频对象(VO,Video Object)、视频对象层(VOL,Video Object Layer)、视频对象组层(GOV,Group of Video Object Plane)、视频对象平面(VOP,Video Object Plane)。这些不同的元素以不同的层次组合起来,结合MPEG-4视频档次(MPEG-4 Visual Profile),成为表示图像的数据流。
交互性是MPEG-4的一个重要概念。事实上,由于其本身的复杂性,AV(Audio Video,音频、视频)研究被分割到许多技术领域,而各领域都或多或少地在进行独立的研究。为此MPEG提出了一个AV信息可以以不同方式显现和处理的方案,这意味着MPEG-4试图同时集成自然的与合成的AV物体,包括单声道、立体声和多声道音频,以及2D和3D或者单目、立体或多目视频。
最近刚刚提出不久的H.264(ITU-T命名),或称之为MPEG-4 AVC(ISO/IEC命名),是一种由ITU-T与ISO/IEC正在联合进行开发的视频编解码方案,它即将成为MPEG-4标准的第10部分(ISO MPEG-4 Part 10)。尽管H.264/MPEG-4 AVC这项技术还没有得到正式批准,但是可以降低50%或更多带宽的能力,将会对无线视频通信的应用产生巨大的影响。
基于MPEG-4的无线视讯技术中的关键技术主要是MPEG-4的编码和解码技术。
1.MPEG-4编码器
编码器可以分为预处理、速率控制、运动估计和比特流编码算法等部分。每一部分在实现过程中都有很大的弹性,而且每一部分都针对不同的应用和实现方案进行了优化。
在预处理中,主要功能是对输入的可视素材进行再采样,使之符合标准的分辨率和数据格式。这使得它对来自不同类型设备的输入有着很灵活的适应性。
速率控制也是一个重要的编码问题。其目标是分配必需的量化时间和空间,尽可能在保持最佳图像质量的情况下来维持一个恒定的比特率,或是在尽可能低的速率下保持一个固定的图像质量。
具体算法开发中的一个关键问题是其灵活性,速率控制算法应该是可调节的,而且能够适应不同的网络和系统。这一点在移动通信中是非常重要的。比方说,一个手机所接收到的数据流速率是非常低的,而一个移动的笔记本电脑在通信过程中所要求的带宽要大于手机的带宽,软件的设计要充分考虑不同的使用情况。这种灵活性还可以动态地在服务器端和客户端调整通信速率,在第2.5代和第3代无线通信中是非常有意义的,因为在它们的通信标准中规定了不同的数据流发送速率,以确保在不同的网络状况中保证服务质量。
在视频编码器中,计算复杂度最大的部分是运动预测。这是因为运动预测包括一种反复计算,以确定邻近帧中宏块的相关性。该计算其实是进行一种匹配操作来寻找最佳匹配,它将产生最佳预测。这通常用称为绝对差值和(SAD)的一种均方误差的近似来完成。
此外,比特流编码、MPEG-4重同步(使解码器和比特流在错误被检测后能够再同步)、MPEG-4数据分割(通过将运动信息和宏块头信息从纹理信息中分离出来完成)、MPEG-4数据恢复(它使用MPEG-4中提供的工具,例如用于恢复数据的变长编码等)等也是关键的编码技术。
2.MPEG-4解码器
基于MPEG-4的无线视讯的另一个关键部分是它的解码方案。为了