音频标准和人们对声音质量要求的提高而不断变化。人的听觉范围是20Hz到20KHz之间的频率,语音信息一般包含在100-7KHz的范围内,音乐和其他声音则通常涵盖更宽的频率范围。普通电话标准最高能提供3.4kHz,而要达到FM广播的标准则需要7kHz频率,而如果要达到CD的效果则需要视频会议系统应该具有能再现20-20kHz 范围的能力。
众所周知,普通的模拟话音经过抽样、编码,通常为64K带宽,而要实现高效的语音传输,必须在不影响话音质量的前提下对话音数据进行压缩。G.711是、G.728、G.729、 G.723.1都是是普通电话的标准,只不过随着压缩格式的不同而占用的带宽不同。G.722是高质量语音编码,占用网络48-64 kbit/s,能达到调频广播的音质,也就是7kHz。目前,大多数视频会议产品都采用G系列标准协议,音频大都是电话的效果,最高也只是达到调频广播的效果。
近几年来,MPEG系列的视音频编解码方式也应用于视讯会议技术中,MPEG系列主要针对运动图像特征下采用的视音频压缩编码的算法。但国内有个别厂家采用了MP3音频编码,MP3对音频信号采用的是有损压缩方式,压缩比越高,失真越大。权威机构测试表明,以128kbps的压缩比传输MP3仍然是比较粗糙的,高频部分压缩后失真非常明显,听起来空洞,干瘪、刺耳,还时常有恍惚的声音,甚至可能会听错。如果需要达到好的效果就要提高音频占用的带宽资源,因此,MP3音频标准并不适合视频会议。
高效的压缩技术使得话音对带宽占有越来越少,促进了音频技术的应用。但是,视讯业务对网络的时延、抖动比较敏感。目前,很多视频会议系统的声音效果并不理想,音量太低,音质差,有回声和噪音的影响也经常出现,用户仅仅停留于听得见的地步,却远远没有达到听得清晰、听得完美的境界。有关专家指出,不管是在56k的低带宽条件下,还是在不稳定的网络环境中,声音传输要保证连贯,就需要音频标准支持回音消除、网络自适应、丢包补偿等技术,才能使现场听起来声音相当清晰,而目前的标准都不能很好的支持。
参考资料
http://www.ccw.com.cn/news2/mfr/htm2005/***********_16ESN.htm