在Internet传播声音(二) - 王朝网络宽屏版

成员

说明

Pwfx

一个TWaveFormatEX结构指针用来接收结果（这里我们实际上用的是TACMFormat）。

Cbwfx

接收结果的缓冲区大小。

CbStruct

结构大小。

另一个值得一提的成员是fdwStyle, 它包括用来指定格式额外信息的标志。特别是下面这个标志：

ACMFORMATCHOOSE_STYLEF_INITTOWFXSTRUCT

这个标志表明pwfx指向的缓冲区已经包括了一个有效的格式，当acmFormatChoose函数调用后，会显示一个格式选择对话框，有效格式将显示为缺省值。

什么情况下无法转换?

一个原因就是一台机器上有的Codec可能另一台机器上没有。这样导致了你可以读取一个声音格式，但无法生成这个声音格式。Fraunhoffer IIS MP3 Codec就有这个问题。在Windows 9x 和Windows NT下，我们可以生成MP3文件，但在Windows 2000却去掉了这一功能L，结果虽然在Windows2000下我们可以听MP3，当我们无法生成MP3，除非我们交一笔钱，faint。

另一个原因是并非所有的ACM格式可以相互转换。比如,我们无法在下面的格式间转化：

GSM 8位单声道 > MP3 8位单声道

虽然无法直接转换，但可以通过中间格式来间接转换，中间格式通常是PCM格式，这是因为绝大多数Codec都支持PCM格式的转换。新的转换途径就变成了:

GSM 8位单声道 > PCM 8位单声道 > MP3 8位单声道

而转换为"MP3 16位立体声"还需要增加一步，就是把8位 PCM格式转换为16位PCM格式。

ACM的潜在本领

可能从上面的介绍来看ACM的功能很有限，仅仅是能把一个媒体格式转换为另一个媒体格式。不过一想到需要自己写一个可用于Internet的声音流的编码解码器的工作量，比如MP3的压缩函数，你就会发现ACM真的是个好东东，价格便宜量又足J。

同时想像一下有了ACM我们实现一个Internet电话是多么的简单，首先从麦克风获得输入的声音数据，压缩为一个合适的基于低带宽的流格式，然后通过TCP/IP协议传到目的计算机。同时，目的计算机接收压缩的数据，解压缩，最后通过扬声器播放出来。

ACM的潜在本领就在这里，有相当多的ACM codec是可映射为Wave格式的，这就是说它们可以作为标准的波设备来实时的播放或记录音频。而网络电话的最主要的要求之一就是实时性。

比如，我们可以很容易的打开一个GSM的声音输入源，一旦我们从波输入设备接收到数据，数据就已经被压缩好了，可以立即传输。同时，一旦通过TCP/IP Socket接收到了数据，我们马上可以通过波输出设备播放之。

要注意标准的PCM格式数据对于通过Modem实现实时的语音传输来说实在是太大了，而GSM 6.1只要1.5K/秒就可以达到实时的效果，而16位单声道的MP3 也仅仅需要2K/秒的带宽。

另外对于MP3格式来说，它可以作为一个播放格式，但它不适合作为输入格式（因为只有Windows NT平台上的MP3 Codec才支持MP3的编码），通常我们需要用其它程序手工转换生成MP3,所以它不适合应用在网络电话上,不过它是非常适合于网络点播的，因为它的压缩比高，而且音质失真少。

原理就是象上面描述的那样简单，但很多事情总是说起来容易，做起来难。所以，下面实现了几个控件和程序来实际的演示一下。由于代码比较长，这里就不详细列出来了，只简单的说明一下。

控件

l TACMConverter:这个控件有两个作用。第一，它可以在两个不同媒体格式间转化数据。第二，这个控件可以用来指定ACM流的输入输出格式。(用右键调出控件的控件编辑器可以在设计时调用AcmFormatChoose函数显示格式选择对话框来指定格式)。

l TACMIn:用来从麦克风接收数据，我们使用标准的PCM格式或其它波输入设备支持的格式来记录数据。

l TACMOut:这个控件是用来回放声音的。NumBuffers属性可以用来指定开始播放前使用的缓冲区数。这对于实时音频传输意义不大，但对于在Internet上音频广播却是很方便，同时当连接数据波动时可以缓冲额外的音频数据。

演示

第一个例子使用TACMConvertor控件来指定输入输出格式，然后打开一个ACMIn和ACMOut控件。麦克风输入的数据立刻回放，但有一点延迟，来产生一点回响