语音编码为信源编码,分为三类:波形编码、参量编码和混合编码。
波形编码将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。其基本原理是在时间轴上对模拟语音按照一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是其反过程。
参量编码又称声源编码,将信源信号在频率域或者其他正交变换域提取参量特征,将其转换为数字代码进行传输。解码为其反过程,将数字序列经过变化恢复特征参量,重建语音信号。具体说,参量编码是通过对语音信号特征参数的提取和编码来重建语音。
80年代后,混合编码结合波形和参量编码,力图保持波形编码的高质量和参量编码的低速率,在4Kbit/s ~ 16Kbit/s速率上得到高质量的合成语音,发展出MPLPC(多脉冲激励线性预测编码),KPELPC(规划脉冲激励线性预测编码),CELP(码本激励线性预测编码)等
语音编码技术中,对音质的评定方法是主观评定等级,或称平均评定得分(Mean Opinion Score,MOS)
质量等级 分数 收听注意力等级
优 5 可以完全放松,无需注意力
良 4 需要注意,但是无需明显集中注意力
满意(正常) 3 中等程度注意力
差 2 需要集中注意力
劣 1 即使努力去听,也很难听懂
转自3G 技术和UMTS网络