随着计算机的发展以及电子技术的发展,人们进入了MPC(多媒体计算机)时代,人们的生活离不开多媒体计算机,下面是笔者在多媒体处理方面的一些学习随笔,让我们一起来看看多媒体信息是怎样经过计算机处理的。
要讲到多媒体信息我们还是从我们的现实生活开始吧!世界上的万事万物在人的眼中都是一个与时间紧密相连,是一个连续的模拟的世界。例如:采集来的声波在时间上是一个连续的。我们把这种信号称为模拟信号。再来看看我们的计算机,根据冯诺依曼原理我们说电子计算机是靠电子线路中两个态来工作的,即开关电路惑高、低电平来工作,用它来表示0和1两个数字,采用访存结构,那么在我们的计算机里面就都是0和1组成的数字量,我们成为数字信号,它们是离散的,那么这里就存在一个问题,我们采集的模拟信号必须经过A/D(数模转换)才能被我们的计算机所接受,那我们先来看看A/D转换。
在理论上我们采用微积分里面的傅立叶级数来处理数模转换或者模数转换,具体的参考信号处理方面的书籍,我们只看看图表,有一个模拟信号量如图一所示,
图一
我们用一个脉冲信号与它叠加起来如图二所示
图二
就像我们初中学习函数坐标图画法时一样,这条曲线,我们可以用无数多个点表示,描述点越多描述的越象,这些点可以是非周期性的。取样后得到如下图三
图三
这样就变成了数字信号,关于算法才用了傅立叶级数来处理。
*引用一段论文里面的材料学习【初仁欣赵伟董小刚 《数字合成周期信号的频谱及信噪比》 清华大学学报 2000Vol.40No.1P.21-24】
非均匀采样周期信号的数字频谱
设g(t)是一个模拟信号,其Fourier变换为模拟信号的频谱Ga(ω),带限为
。 将信号g(t)按照下述方式采样:相邻采样点之间间隔不均等,但每个采样点与其后第M个采样点之间的间隔相等,即总采样周期为MT, T为平均采样周期,如图3所示。图3信号的非均匀采样
非均匀取样信号的数字频谱可表示为
(1)
式中 rm=(mT-tm)/T 是mT-tm与平均采样周期T的比值。
设f(t)是一个周期为T0的信号。 f(t)以上述方式被非均匀采样,总采样周期为MT。 f(t)的傅立叶级数可表示为
(2)其中: 角频率ω0=2π/T0,且第n阶Fourier级数系数
。 f(t)的Fourier变换为(3)根据周期信号占有频带的确定原则[3],取2N1(N1为整数)作为周期信号的占有频带项,式(3)可改写为
(4)由式(1)和式(4)可得
(5)式中 fs=1/T为平均采样频率。
现定义A(n,k)(-∞
(6)则式(5)可写为
(7)式(6)和式(7)即为非均匀采样周期信号的频谱表达式。
非均匀采样周期信号频谱的性质有: 1) 由式(6)可以看出,序列A(n,k)是k的周期函数,其周期为M, 因此,式(7)中F(ω)是ω的周期函数,周期为2π/T=2πfs; 2) 周期信号被非均匀采样后, Fa(ω)的每根谱线|an|均产生一系列“寄生谱线”;这些“寄生谱线”在频率轴f上均匀分布,且相邻谱线间隔为fs/M。 上述性质表明,非均匀采样后周期信号的第n阶谐波分量在频率轴上位于nω0处,幅值为|A(n,0)|;而“寄生谱线”位于
处(m=1,…,M-1), 幅值为|A(n,m)|。由式(6)可知,有限序列A(n,k)是序列的离散Fourier变换,由Parseval定理可得(8)于是,非均匀采样周期信号的信噪比可写为
(9)
来看一个实例,我们知道CD音乐的采样频率一般是44.1k,即一秒钟抽样44.1k,一般回放采样字节为16位,当然也有更高的精品CD咯,以16位为例,一秒钟的音乐容量就要176.4KB,650M的光盘就能播放61分钟的音乐了,但是达到了很高的音质。
当信号进入到计算机里面后,我们再来看看数字信号是如何在计算机中处理的,举例来看,一张A4幅面(21.6cm×30m)的照片,如果用12点/mm(dpm)的分辨率,用24位彩色信号表示时的数据量是25MB,这种用数字来直接描述点的图片会非常的清晰,这就是常见的WINDOWS位图文件(.BMP)缺点是图片的容量太大,在网络迅猛发展的今天,这种格式的图片在网络上传输显然不好,于是人们要得到一种容量小,图像清晰的格式,常见的有静态图像小组(.JPG),来分析BMP图片,我们可以将其中的一小部分抽出来,其余的略去,这样的到的图片清晰度降低了,同时图片的容量大大减少了,对于人的眼睛来说,分不出BMP图片与JPG图片的清晰度,只有在放大图片的时候,才能分出图片的质量,我们称这种图片的压缩为有损压缩。来详细分析一下JPEG技术,现有的JPEG技术采用的是离散余弦变换算法(DCT)在平稳过程中将图像数据压缩成正方形8×8的“象素信息模块”并按照一定顺序排列存储形成压缩文件,经过多次压缩后,图像文件只保留最为重要的数据信息,而肉眼当然是分辨不出来。另外还有一种方式是离散子波(wavelet)变换算法,它采用频域或时域局部考察方式,即在信号分析中对高频成分采用由粗到细的时空域上进行取样,所以能构造出远景的高清晰度,这种算法对JPEG压缩比有较大提高,但是还是有损压缩。这种压缩还应用在视频处理上。
作为新一代图片格式JPEG 2000采用了预测法作为图像进行无损编码方式。使之能实现无损压缩(loseless compression)或交互压缩(保留某一部分图像低压缩比以求清晰度)。作为无损压缩的代表,我们来看看日常生活中常见到的GIF图片格式,它采用LZ算法来实现。来看看LZ算法,它是一种词典编码方式,建立在Lempel和Ziv发表的算法,所以称为LZ算法,它包括;LZSS、LZW、LZ77等,都是无损算法。
(未完)