摘要:讲述现今常见的在特定领域有代表性的文件格式,并没有深入讲述每种格式的存储状态(方式),只对相应格式的特性优缺点做简要概述。
关键字:计算机,文件格式,图形,图像,音频,视频,流媒体,手机铃声
分析现行的常用的文件格式类别
简要的说数据信息在存储器中存储的排列方式不同为啦方便理解和交流规范为不同的文件格式,这点在linux上边可以较为明显的看出:linux只规范不同文件的属性,后缀名是为啦方便记忆和沟通等
……
图形文件格式
windows中的标准图像文件格式
BMP文件格式
BMP是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BblP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。
典型的BMP图像文件由三部分组成:位图文件头数据结构,它包含BMP图像文件的类型、显示内容等信息;位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息。
可在Macintosh、Amiga、Atati、IBM机器间进行移植的一种标准图像格式。
GIF(Graphics Interchange Format)文件
GIF(Graphics Interchange Format)的原义是“图像互换格式”, 顾名思义,这种格式是用来交换图片的。事实上也是如此CompuServe公司在 1987年针对网络传输带宽的限制开发的图像文件格式。GIF文件的数据,是一种基于LZW算法的连续色调的无损压缩格式。其压缩率一般在50%左右,压缩比高,磁盘空间占用较少。它不属于任何应用程序。目前几乎所有相关软件都支持它,公共领域有大量的软件在使用GIF图像文件。GIF图像文件的数据是经过压缩的,而且是采用了可变长度等压缩算法。所以GIF的图像深度从lbit到8bit,也即GIF最多支持256种色彩的图像。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。
GIF分为静态GIF和动画GIF两种,支持透明背景图像,适用于多种操作系统,“体型”很小,网上很多小动画都是GIF格式。其实GIF是将多幅图像保存为一个图像文件,从而形成动画,所以归根到底GIF仍然是图片文件格式。
GIF文件扩展名为.gif。考虑到网络传输中的实际情况,GIF除了一般的逐行显示方式外,还增加了渐显方式。也就是说,在图像传输过程中,用户可以先看到图像的大致轮廓,随着传输过程的继续而逐渐看清图像的细节部分,从而适应了用户的观赏心理,这种方式以后也被其他图像格式所采用,如JPEG等。最初,GIF格式只是为了存储单幅静止图像,称为GIF87a,后来进一步发展成为GIF89a,可以同时存储若干静止图像进而形成了动画。目前,网络上许多动画文件就采用了GIF89a以前可以说是它最大的优点,不过现在已逐渐被Flash所替代。GIF文件的应用范围很广,是可在Macintosh、Amiga、Atati、IBM机器间进行移植的一种标准图像格式。
对应于GIF文件的文件格式——swf
SWF(Shockwave Format)文件
SWF是二维动画软件Flash中的矢量动画格式,主要用于Web页面上的动画发布。目前,已成为网上动画的事实标准。SWF文件的扩展名为.swf。
同样是动画文件格式——动画序列文件
flc文件格式
Autodesk Animator和Animatorpro的动画文件,支持256色,最大的图象象索是64000*64000,支持压缩,广泛用于动画图形中的动画序列,计算机辅助设计和计算机游戏应用程序。
用于连续色调静态图像压缩的标准
JPEG
JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为".jpg"或".jpeg",是用于连续色调静态图像压缩的一种标准,最常用的图像文件格式,由一个软件开发联合会组织制定,是一种采用预测编码(DPCM)、离散余弦变换(DCT)以及熵编码,以去除冗余的图像和彩色数据的有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像品质。而且 JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。比如可以把1.37Mb的BMP位图文件压缩至20.3KB。当然也可以在图像质量和文件尺寸之间找到平衡点。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。
JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在 Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。其中0级压缩比最高,图像品质最差。即使采用细节几乎无损的10 级质量保存时,压缩比也可达 5:1。以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:1。经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的"感兴趣区域" 特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。
JPEG2000和JPEG相比优势明显,且向下兼容,因此可取代传统的JPEG格式。JPEG2000即可应用于传统的JPEG市场,如扫描仪、数码相机等,又可应用于新兴领域,如网路传输、无线通讯等等。
JPEG格式的主要不足之处也正是它的最大优点。也就是说,有损压缩算法将JPEG只局限于显示格式,而且每次保存JPEG格式的图像时都会丢失一些数据。因此,通常只在创作的最后阶段以JPEG格式保存一次图像即可。
虽然jpeg有很多优点不过如果要打印图像,特别是打印高质量的图像,TIFF格式是更为合适的选择。下面就介绍下TIFF格式。
TIFF文件格式
TIFF是Tagged Image File Format(标记图像文件格式)的缩写,此种文件格式是由Aldus和 Microsoft公司为扫描仪和台式计算机出版软件开发的,是用来为存储黑白图像,灰度图像和彩色图像而定义的存储格式,现在己经成为出版多媒体 CD-ROM中的一个重要文件格式。虽然TIFF格式的历史比其它的文件格式长一些,但现在仍是使用最广泛的行业标准位图文件格式,这主要是由于TIFF格式的规格经过多次改进。 TIFF位图可具有任何大小的尺寸和分辨率。在理论上它能够有无限位深,即:每样本点1-8位、 24位、32位(CMYK模式)或48位(RGB模式)。 TIFF格式能对灰度、J健、CMYK模式、索引颜色模式或RGB模式进行编码。它能被保存为压缩和非压缩的格式。几乎所有工作中涉及位图的应用程序,都能处理TIFF文件格式——无论是置入、打印、修整还是编辑位图。
TIFF的规范允许使用CMYK和 RGB这两种颜色模式,即可将图像分成4种套印颜色,并且将分色前的图像保存为TIFF格式。将TIFF格式文件置入页面版式设计或相似程序肘,就不要求做进一步的分色。当印刷青色印版的时候,程序只是简单地拉住青色通道;印刷红色印版的时候,只是简单地拉住品红色通道即可;依次类推。TIFF格式也可保存索引颜色位图,但是很少有人这么做。对索引颜色图像,更多的时候是选择使用GIF格式。
TIFF格式可包含压缩和非压缩象素数据。压缩方法(LZW)是非损失性的(图像的数据没有减少,即信息在处理过程中不会损失),能够产生大约2:1的压缩比,可将原稿文件消减到一半左右。
TIFF格式现在的版本支持高分辨率颜色,它把一幅图像的不同部分分成块状,或者说是数据块。对于每个块状部分,都保存了一个标志,其中提供了块状看起来是什么样的信息。块状的优点是支持TIFF格式的软件包只需要保存当前显示在屏幕上的那部分图像。而没有在屏幕上显示的图像部分还保存在硬盘上,等到需要时才装入内存。当编辑一幅非常大的高分辨率图像时,这一特性就很重要。
在TIFF文件中,没有任何工具含有网屏处理指令。网屏处理由印刷TIFF格式文件的程序控制。如果想在保存位图的同时保存网屏处理指令,则必须使用EPS文件格式。但是TIFF格式能够处理剪辑路径,无论是QuarkXPress还是 PaceMaker,都能读取剪辑路径,并能正确地减掉背景。
文件扩展名为TIF或TIFF。支持RAW、RLE、LZW、JPEG、 CCITT3组和4组等多种压缩方式。
在打印行业还有一种文件格式——EPS
EPS文件格式
是PC机用户较少见的一种格式,而苹果Mac机的用户则用得较多。它是用PostScript语言描述的一种ASCII码文件格式,主要用于排版、打印等输出工作。PostScript语言是Adobe 公司设计用于向任何支持PostScript语言的打印机打印文件的页面描述语言。除了它是被优化用于纸张上打印文字和图像之外,它像Basjc 语言、C语言或任何其它编程语言一样。当你在 PostScript打印机上工作并告诉文字处理器(或任何其它的应用程序)打印页面时,计算机就会用PostScript语言编写一个程序描述该页面,并将这个程序传送给打印机。打印机实际上其中装有一台功能齐全的计算机和PostScript 语言解释器执行这个程序,将图形画在内存中的虚拟纸张上,然后将其打印到纸上。
EPS文件就是包括文件头信息的PostScript 文件,利用文件头信息可使其他应用程序将此文件嵌入文档之内。EPS文件还有一些限制,而这些限制并不适用于标准的PostScript文件。这些限制主要就是一些规则,以保证EPS文件可以插入到不同的文件中,而不会损伤该文件。例如:在Microsoft Word中,可以在一个Word中,可以在一个Word文档中嵌入ESP文件。EPS文件最流行的应用就是将其嵌入桌面出版文件中,特别是由PageMaker或是QuarkXPress创建的文件。桌面分色(DCS)就是由Quark公司开发的,用于套印色(Process color)处理。DCS图像是EPS格或图像,由5部分组成:低分辨率的屏幕预览,再加上青色、品红色、黄色和黑色图层。 DCS2.0版文件可包括4种以上的套印色,也可以在其中包括一定数量的专色(spot color) 或者是高保真度的分色。
EPS文件格式可用于像素图像、文本以及矢量图形的编码。如果EPS只用于像秦基图像(例如选择Adobe Photoshop程序作为输出),挂网信息以及色调复制转移曲线可以保留在文件中,而TIFF则不允许在图像文件中包括这类信息。
由于EPS文件实际上是PostScript语言代码的集合,因而在PostScript打印机上可以以多种方式打印它。创建或是编辑EPS文件的软件可以定义容量、分辨率、字体和其他的格式化和打印信息。这些信息被嵌入到 EPS文件中,然后由打印机读入并处理。有上百种打印机支持PostScript语言,包括所有在桌面出版行业中使用的图像排版系统。所以,EPS格式是专业出版与打印行业使用的文件格式。
EPS格式是一种用于打印的格式。嵌入到EPS文件中的PostScript语言代码提供了重要的打印定义,但是,这就使得文件的尺寸变大。除此之外,为了在软件中建立PostScript引擎所需要的价值和内存开销也是较高的。结果大多数的Web浏览器不支持EPS文件,大多数图像查看共享软件和自由软件也都不支持EPS文件。由于这种原因,EPS格式不能用在Web站点的图像显示上。
类似与ESP使用postscript语言还有一种文件格式——PDF
pdf文件格式
PDF全称Portable Document Format,是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF格式文件目前已成为数字化信息事实上的一个工业标准。
Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。PDF格式文件目前已成为数字化信息事实上的一个工业标准。
PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。
对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。
PDF的优点在于这种格式的电子读物美观、便于浏览、安全性很高。但是这种格式不支持CSS、Flash、Java、JavaScript等基于HTML的各种技术,所以它只适合于浏览静态的电子图书。
企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性
png文件格式
PNG是20世纪90年代中期开始开发的图像文件存储格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。流式网络图形格式(Portable Network Graphic Format,PNG)名称来源于非官方的“PNG's Not GIF”,是一种位图文件(bitmap file)存储格式,读成“ping”。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。PNG使用从LZ77派生的无损数据压缩算法。
PNG文件格式保留GIF文件格式的下列特性:
使用彩色查找表或者叫做调色板可支持256种颜色的彩色图像。
流式读/写性能(streamability):图像文件格式允许连续读出和写入图像数据,这个特性很适合于在通信过程中生成和显示图像。
逐次逼近显示(progressive display):这种特性可使在通信链路上传输图像文件的同时就在终端上显示图像,把整个轮廓显示出来之后逐步显示图像的细节,也就是先用低分辨率显示图像,然后逐步提高它的分辨率。
透明性(transparency):这个性能可使图像中某些部分不显示出来,用来创建一些有特色的图像。
辅助信息(ancillary information):这个特性可用来在图像文件中存储一些文本注释信息。
独立于计算机软硬件环境。
使用无损压缩。
PNG文件格式中要增加下列GIF文件格式所没有的特性:
每个像素为48位的真彩色图像。
每个像素为16位的灰度图像。
可为灰度图和真彩色图添加α通道。
添加图像的γ信息。
使用循环冗余码(cyclic redundancy code,CRC)检测损害的文件。
加快图像显示的逐次逼近显示方式。
标准的读/写工具包。
可在一个文件中存储多幅图像。
文件结构
PNG图像格式文件(或者称为数据流)由一个8字节的PNG文件署名(PNG file signature)域和按照特定结构组织的3个以上的数据块(chunk)组成。
PNG定义了两种类型的数据块,一种是称为关键数据块(critical chunk),这是标准的数据块,另一种叫做辅助数据块(ancillary chunks),这是可选的数据块。关键数据块定义了4个标准数据块,每个PNG文件都必须包含它们,PNG读写软件也都必须要支持这些数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码,但规范提倡支持可选数据块。
计算机生成图像向电视转换的一种首选格式
TGA(Tagged Graphics)文件
TGA是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。现在已成为数字化图像,以及运用光线跟踪算法所产生的高质量图像的常用格式。TGA文件的扩展名为.tga。TGA的结构比较简单,属于一种图形、图像数据的通用格式,目前大部分文件为24位或32位真彩色,在多媒体领域有着很大影响。由于Truevision公司推出TGA的目的是为了采集、输出电视图像,所以TGA文件总是按行存储、按行进行压缩的,这使得它同时也成为计算机生成图像向电视转换的一种首选格式。
两种mcrosoft Windows中的图元文件格式
Wmf文件格式
Microsoft Windows中常见的一种图元文件格式,它具有文件短小,图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较粗糙,并且只能在Microsoft Office中调用编辑。
EMF(Enhanced Metafile)文件格式
EMF是微软公司开发的一种Windows
32位扩展图元文件格式,是矢量文件格式。其总体目标是要弥补使用WMF的不足,使得图元文件更加易于接受。EMF文件的扩展名为.emf。
创建非常详细和精确的图表和图形
DXF文件格式
DXF:AutoCAD 绘图交换文件
DXF 是 Autodesk AutoCAD 程序使用的基于矢量的 ASCII 格式。AutoCAD 可以提供非常详细的完全可以缩放的图表。
优点: 您可以使用 AutoCAD 创建非常详细和精确的图表和图形。
AutoCAD 文件在建筑、设计和雕刻行业很流行。
缺点: AutoCAD 在 Office 中受到的支持很有限,Office 支持 R12 之前的 AutoCAD 版本。
AutoCAD 具有很陡的学习曲线。请注意,其他图形程序也可以导出 DXF 图片。
两种摄影爱好者的文件格式
RAW文件格式
RAW文件几乎是未经过处理而直接从CCD或CMOS上得到的信息,通过后期处理,摄影师能够最大限度地发挥自己的艺术才华。
RAW文件并没有白平衡设置,但是真实的数据也没有被改变,就是说作者可以任意的调整色温和白平衡,并且是不会有图像质量损失的。
颜色线性化和滤波器行列变换在具有微处理器的电脑上处理得更加迅速,这允许应用一些相机上所不允许采用的、较为复杂的运算法则。
虽然RAW文件附有饱和度、对比度等标记信息,但是其真实的图像数据并没有改变。用户可以自由地对某一张图片进行个性化的调整,而不必基于一、两种预先设定好的模式。
也许RAW最大的优点就是可以将其转化为16位的图像。也就是有65536个层次可以被调整,这对于JPG文件来说是一个很大的优势。当编辑一个图像的时候,特别是当你需要对阴影区或高光区进行重要调整的时候,这一点非常重要。
Exif文件格式
Exif (Exchangeable image file format) 是可交换图像文件的缩写,是专门为数码相机的照片设定的,可以记录数字照片的属性信息和拍摄数据。
Exif 最初由日本电子工业发展协会在 1996 年制定,版本为 1.0。1998 年,升级到 2.1,增加了对音频文件的支持。2002 年 3 月,发表了 2.2 版。
Exif 可以附加于 JPEG、TIFF、RIFF 等文件之中,为其增加有关数码相机拍摄信息的内容和索引图或图像处理软件的版本信息。
Exif 是一个为数码相机使用的图像文件格式而制定的标准规格。它由日本电子工业发展协会(JEIDA - Japan Electronic Industry Development Association)创建。该规格使用现有的文件格式,如 JPEG,TIFF Rev. 6.0,和 RIFF WAVE 音频文件格式,和一些额外添加的特殊元数据标签。它不支持 JPEG 2000 或 PNG。
该规格的 V2.1 版本于 1998 年 1 月制定,V2.2 版本于 2002 年 4 月制定。
在 Exif 标准中定义的元数据标签包括以下几大方面的信息:
日期和时间信息。数码相机将记录当前日期和时间,并把这些信息记录在元数据标签里。
相机设置。这包括静态信息,如相机型号、生产厂商,及每张照片改变的信息(方位、光圈、快门速度、焦距、测光模式和ISO感光速度等信息)。
照片拍摄地的位置信息。可以由 GPS(全球卫星定位系统)接收器连接到数码相机上,来提供相关全球定位信息。2004 年,仅有极少数数码相机支持这个特性。因此,有人使用普通的GPS接受器来记录他当时所在位置的地理信息,然后在图像的时间戳里,根据接受器日志记录的内容,为图像添加相机错失了的照片拍摄地地理信息。
描述和版权信息。一些数码相机高端机型会在相机上提供允许用户编写这部分信息的功能。
范例
下面列出几项在 Exif 里保存的信息(由 Opanda IExif 提供):
项目 信息
制造厂商 = Canon
相机型号 = Canon EOS-1D Mark II
影像方向 = 正常(upper-left)
影像分辨率 X = 72
影像分辨率 Y = 72
分辨率单位 = dpi
处理软件 = Adobe Photoshop CS Macintosh
最后异动时间 = 2005:10:06 12:53:19
YCbCrPositioning = 2
曝光时间 = 0.00800 (1/125) sec
光圈值 = F1.6
拍摄模式 = 光圈优先
ISO 感光值 = 100
Exif 信息版本 = 30,32,32,31
影像拍摄时间 = 2005:09:25 15:00:18
影像存入时间 = 2005:09:25 15:00:18
曝光补偿(EV+-) = 0
测光模式 = 点测光 (Spot)
闪光灯 = 关闭
镜头实体焦长 = 85 mm
Flashpix 版本 = 30,31,30,30
影像色域空间 = sRGB
影像尺寸 X = 800 pixel
影像尺寸 Y = 533 pixel
主流声音视频文件格式
压缩文件格式让歌曲文件更小,更易于保存和在Internet上传播。所有这些都是为了一个目的——让热爱音乐的电脑用户能够方便地交流他们的数字音乐。
由于音乐交流受到欢迎,技术人员便发明出更好的音频格式。除了很少的一部分,如bluematter和WMA,试图达到甚至超过CD的音质外,它们多数朝着版权保护、更小的文件尺寸以及增加花哨的扩展功能(如可视的封面)这些方面努力。
为了理解大多数的音频文件,你应该了解几个术语。传统的音频文件可以存入硬盘或其他的存储介质中,我们把它们叫做"离散文件"或"可下载的文件"。一般来说,这种音乐文件在你通过播放欣赏它(如MP3)之前,需要完全下载它。你可以方便地拷贝许多种格式的离散文件,当然版权问题应该注意。
流式文件(如RealAudio和QuickTime使用的文件格式)是另外一种文件,你可以一边下载一边听。流式媒体播放器下载几秒钟的内容临时存放到缓冲区内,并在继续下载的同时播放缓冲区中的内容,人们不会注意到有什么问题。但一个可能存在的难题是你可能无法很容易地把整个文件保存到硬盘上。应该注意的是一些文件格式如MP3和WMA,既可以是离散文件,也可以是流式文件。如果文件的制作者没有限制的话,你也可以保存RealAudio文件。
如果某些歌曲你只想听一两次,而不想浪费宝贵的硬盘空间,流式文件就很有用处了。要知道,一首歌做成文件可能会有2MB到60MB(视文件格式而定)。内容提供者(唱片公司或歌曲作者)以流式文件发行歌曲可以有效地防止盗版,或者作为一个较低音质的演示片断以鼓励你下载一个完全版的"离散文件"。
网上电台提供了实时的流式文件播放(比如RealAudio格式、WMA格式),不过当网络状态不佳时,由于速度过低,播放时会产生"毛刺",这时,服务器将发送一个信号并从此以较低的速率传输。当越来越多的用户用上Cable Modem或DSL时,高速连接能够轻松地处理高质量的大的流式文件,流式文件就会真正得到普及了。
压缩技术使得音频文件更易于存储和传播。音频文件的压缩一般是去除人类听觉范围之外的声波,或者用大些的声音把它们"盖"住。举例来说,一个未经压缩的50MB的WAV文件,压缩成MP3、WMA或Mjuice(.MJF)文件时可能只有5MB。
还有其他一些因素影响人们对音频文件的选择。比如一首免费的MP3歌曲,它有三个版本:96Kbps(96千比特位每秒)、128Kbps和192Kbps。Kbps(比特位速率),表明了音乐每秒的数据量,Kbps值越高,音质越好,文件也越大,下载时间也就越长。用户普遍认为,128Kbps的MP3文件最接近CD音质,所以如果你喜欢CD的话,就应选择128Kbps的版本。如果你愿意损失一点音质,换取更快的下载速度或是在自己电脑里保存更多的歌曲,不妨选择96Kbps。如果你有一双挑剔的耳朵和很多的存储空间,那就下载192Kbps的MP3吧。
你可能会遇到一些不熟悉的概念,例如,录制WAV文件时,将看到不同的音质表示法:采样频率(Sample Rates)、采样精度(Bit Depth)、声道数(Channels)。采样频率指的是原始的声音每秒钟被记录多少次,以Hz或KHz表示,采样频率越高表示音质越好,不过文件也就越大;声道数表示WAV是单声道(Mono)还是双声道(Stereo)。采样精度有8位、16位或更多,它告诉你电脑在对原始声音的每一次采样时记录了多少信息。 44.1KHz,双声道,16位采样精度即我们平时所说的CD音质的标准。
广泛传播的音乐格式
MP3 文件格式
MP3的全称应为MPEG1 Layer-3音频文件,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标准,MPEG音频文件是MPEG1标准中的声音部分,也叫MPEG音频层,它根据压缩质量和编码复杂程度划分为三层,即Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3这三种声音文件,并根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3格式压缩音乐的典型比例有10:1、17:1,甚至70:1。可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。我们用MusicMatch Jukebox 5.1在128Kbps的频率下编码一首3分钟的歌曲,得到2.82MB的MP3文件。,也就是说,一分钟CD音质的音乐,未经压缩需要10MB的存储空间,而经过MP3压缩编码后只有1MB左右。不过MP3对音频信号采用的是有损压缩方式,为了降低声音失真度,MP3采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。(另MP3PRO:mp3PRO编码器将音频的录音分成两个部分:mp3部分和PRO部分。mp3部分分析低频段(Low Frequency Band)信息,并将其编码成通常的mp3文件数据流。这就使得编码器能够集中编码更少的有用信息,获得更佳品质的编码效果。同时,这也保证了mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的则是高频段(High Frequency Band)信息,并将其编码成mp3数据流的一部分,而这些通常在老的mp3解码器里是被忽略的。新的mp3PRO解码器会有效地利用这部分数据流,将两段(高频段和低频段)合并起来产生完全的音频带,达到增强音质的效果。)
附:MPG
又称MPEG(Moving Pictures Experts Group)即动态图像专家组,它是由国际标准化组织ISO(International Standards Organization)与IEC(International Electronic Committee)于1988年联合成立,专门致力于运动图像(MPEG视频)及其伴音编码(MPEG音频)标准化工作。MPEG是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台支持。它包括MPEG-1,MPEG-2和MPEG-4。MPEG-1被广泛地应用在VCD的制作,绝大多数的VCD采用MPEG-1格式压缩。MPEG-2应用在DVD的制作方面、HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面。MPEG-4是一种新的压缩算法,使用这种算法的ASF格式可以把一部120 min长的电影压缩到300 M左右的视频流,可供在网上观看。
微软公司推出的与MP3格式齐名的一种新的音频格式
Windows Media Audio(WMA) 文件格式
微软的Windows Media Audio 7 (.WMA文件)是一种压缩的离散文件或流式文件,它提供了一个MP3之外的选择机会。WMA相对于MP3的主要优点是在较低的采样频率下它的音质要好些。1999年4月,NSTL( http://www.nstl.com)通过调查发现有51%的听众认为用一个旧版本的WMA以64Kbps录制的歌曲更接近原始歌曲,29%的人认为128Kbps的MP3更好些,还有19%弃权。WMA的作者说新版的WMA文件(版本7)听起来更好些。这意味着前面我们的3分钟的歌曲可以在64Kbps下录制出一个更小的仅有1.43MB的WMA文件,而没有明显的失真。WMA文件以5Kbps、8KHz到192Kbps、44MHz的采样频率录制。
WMA的另一个优点是内容提供商可以通过DRM(digitalrights management)方案如Windows Media Rights Manager 7加入防拷贝保护。你可以下载和播放一个WMA文件,不过如果它受到了保护,你必须要再完成一步。比如,你的浏览器可能要连上另一个站点下载一个许可证文件,这个许可证可能免费也可能值几元钱,也可能只是解除文件的锁定让你能听特定的次数或时间。许多消费者对此提出异议,不过微软和其他SDMI (Secure Digital Music Initiative)的成员声称将来要用这一技术保护音乐。
由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。
在64kbps的数据速率时,在13000-20000Hz频率段就能保留了大部分信息。
但64kbps的WMA的低频表现实在有点令人失望,听上去比较硬,如同加入了哇声效果般,感觉非常不好,当然比同比特64K的mp3要好感觉声音更集中。听觉上64WMA的表现基本接近128kbps mp3的音质水平,但没有达到。96K的wma略好于128K的mp3,WMA在高于128以上的各种比特率表现相差不大,高频和泛音都很丰富,一般人听不出WMA128Kbps以上的音质和音色的差异。
总体感觉WMA的声音偏硬,适合流行摇滚,如果是古典或者纯人声的话,感觉有点生硬,在低于128K时,WMA对于MP3拥有绝对优势!128以上的WMA相比MP3会有薄的感觉 。
在128kbps及以下码流的试听中WMA完全超过了MP3格式,低码流之王不是浪得虚名的。但是当码流上升到128kbp以后,WMA的音质却并没有如MP3一样随着码流的提高而大大提升。
如今电脑上最为常见的声音文件格式
声音波形文件(WAV) 文件格式
由Microsoft公司开发的一种WAV声音文件格式,是如今电脑上最为常见的声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITT μ Law和其它压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大(一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间),所以不适合长时间记录。
WAV文件没有版权保护,唯一阻碍人们用这种格式发布歌曲的原因是它过份的长度。不过,在Windows的声音提示(比如"叮")里,它完成得不错。它还可以用来在硬盘上临时存放要刻录到CD-R上去的歌曲。下载WAV的网站有http://www.wavplace.com。
是如今电脑上最为常见的声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITT μ Law和其它压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大(一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间),所以不适合长时间记录。
苹果公司的AIFF (Audio Interchange File Format)以及原来为Unix开发的AU格式,和WAV非常相像,虽然这几种文件互相之间不能通用,不过很多播放器都支持它们三种。
微软公司开发的一种数字视频压缩格式
WMV(Windows Media Video)文件格式
是微软公司开发的一种数字视频压缩格式。WMV文件一般同时包含视频和音频部分。视频部分使用Windows Media Video编码,音频部分使用Windows Media Audio编码。
WMV是微软推出的一种流媒体格式,它是在“同门”的ASF(Advanced Stream Format)格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。
微软的WMV还是很有影响力的。可是由于微软本身的局限性其WMV的应用发展并不顺利。第一, WM9是微软的产品它必定要依赖着Windows,Windows 意味着解码部分也要有PC, 起码要有PC机的主板。这就大大增加了机顶盒的造价,从而影响了视频广播点播的普及。第二,WMV技术的视频传输延迟非常大,通常要10几秒钟,正是由于这种局限性,目前WMV也仅限于在计算机上浏览WM9视频文件。
适合在IP网上传输的文件格式
ASF文件格式
ASF是一个开放标准,它能依靠多种协议在多种网络环境下支持数据的传送。同JPG、MPG文件一样,ASF文件也是一种文件类型,但它是专为在IP网上传送有同步关系的多媒体数据而设计的,所以ASF格式的信息特别适合在IP网上传输。ASF文件的内容既可以是我们熟悉的普通文件,也可以是一个由编码设备实时生成的连续的数据流,所以ASF既可以传送人们事先录制好的节目,也可以传送实时产生的节目。
ASF 用于排列、组织、同步多媒体数据以利于通过网络传输。ASF 是一种数据格式,它也可用于指定实况演示。ASF最适于通过网络发送多媒体流,也同样适于在本地播放。任何压缩/解压缩运算法则(编解码器)都可用来编码ASF流。
Windows Media Service的核心是ASF。ASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体内容发布。其中,在网络上传输的内容就称为ASF Stream。ASF支持任意的压缩/解压缩编码方式,并可以使用任何一种底层网络传输协议,具有很大的灵活性。
Microsoft Media player是能播放几乎所有多媒体文件的播放器,支持ASF在Internet网上的流文件格式,可以一边下载一边实时播放,无需下载完再听。
1:创建ASF文件
如何生成ASF文件呢?在此提供软件和硬件的两种方式,供有兴趣的用户参考。
1.通过软件将MPEG-1格式的影像文件转换成微软最新的ASF视频流格式。使用软件工具为:Sonic Foundry Stream Anywhere和Windows Media Toolkit。具体实施步骤为:首先安装Windows Media Toolkit或把相应版本号的ASF压缩编码驱动库拷贝到Windows/System目录。
接着运行软件——Sonic Foundry Stream Anywhere。打开mpg文件。选择“Save as”(另存为)→选择你要储存ASF文件的文件夹→选择“Encode Windows Media Format”项→设置你要生成的ASF文件的压缩比例。如果选250 Video的话就相当于2MB/分钟的压缩速度,图像的质量不太好。同理,如果是选512 Video相当于4MB/分钟的压缩速度。其实,质量好的ASF应该是在320×240和有30帧/秒的情况下,它的图像和声音仍然可以同步。最后,取消Encode Real Media format选项并确认完成。
2.利用专用的视频采集卡(Ospres-200),借助“Netshow Ecorder 3.0”软件把录像机、影蝶机、摄像机等视频、音频信号转换成ASF格式。对已是数字格式的dat、mpg文件,可以通过豪杰超级解霸2000中的工具——“vcd转avi”程序,先转换成avi格式,再使用采集卡附带的软件完成转换。具体过程在此不作介绍。
对以上两种形式来说,使用第二种效果比较好,画面信号损失少,图像质量更高。
利用ASF文件
ASF流文件的数据速率可以在28.8Kbps到3Mbps之间变化。用户可以根据自己应用环境和网络条件选择一个合适的速率,实现VOD点播和直播。
1. 点播功能(Video On Demand)
因为ASF技术支持任意的压缩/解压缩编码,可以使用任何一种底层网络传输协议,这使它既能在高速的局域网内使用,也可以在拨号方式连接的低带宽Internet环境下使用。点播服务方式下,用户之间互不干扰,可以对点播内容的播放进行控制。这种方式最为灵活,但是占用服务器、网络资源多。
ASF的点播内容均存放在VOD服务器上,建立VOD站点进行网页发布,在同一时间可多点同时点播相同或不同的节目,即多个计算机可在不同的地点、不同的时刻,实时、交互式地点播同一ASF流文件,用户可以通过上网查看和选择内容进行点播。播放过程中可实现播放、停止、暂停、快进、后退等功能,播放速率达到25帧/s,1小时的视频信息按照300Kb/s采集,只占108MB的空间,1张640MB的光盘可存放将近6小时的ASF文件。
2. 直播功能
直播服务下,用户只能观看播放的内容,无法进行控制。可以使用ASF文件作为媒体内容的来源,实时的多媒体内容最适合使用直播服务方式。通过视频捕捉卡把摄像机、麦克风记录的内容输入到计算机,进行编码生成ASF流,然后通过该机把信号传送到网络,用户通过网页收看直播内容。
计算机可同时接收相同或不同的节目频道,直播计算机可作为一个小电视台,连在网上的每一台计算机都可实时接收9个不同的节目频道。
3. 远程教育
这种远程教育系统由制作计算机、VOD服务器、用户机组成。
制作计算机安装视频采集卡、声卡及摄像机,用于制作流媒体文件;VOD服务器用于存储和发布流媒体信息;用户机是连在网上的普通多媒体计算机,通过网页进行学习。网页上有教员授课的视频文件、多媒体课件、学习内容提要、参考资料、复习/练习题、作业等信息。
ASF的主要优点包括:
本地或网络回放
可扩充的媒体类型
部件下载、可伸缩的媒体类型
流的优先级化
多语言支持、环境独立性
丰富的流间关系以及扩展性等
RealAudio 文件格式
RealNetworks是最大的流式媒体的名字,它的文件格式比较混乱:有RA(RealAudio)、RM (RealMedia, RealAudio G2)、RMX (RealAudio Secured),还有更多。不少网站把这些文件统称为"Real"。如果你的RealPlayer软件不能处理这种格式,它就会提醒你下载一个免费的升级包。特点是可以在非常低的带宽下(低达28.8kbps)提供足够好的音质让用户能在线聆听。这一特点在互联网的早期简直是广大网虫的福音。也就是因为出现了Real Media之后,相关的应用比如网络广播,网上教学,网上点播等等才浮出水面,形成了一个新的行业。
网络流媒体的道理其实非常简单,简单说就是将原来连续不断的音频分割成一个一个带有顺序标记的小数据包,将这些小数据包通过网络进行传递,在接收的时候再将这些数据包重新按顺序组织起来播放。如果网络质量太差,有些数据包收不到或者延缓了到达,它就跳过这些数据包不播放,以保证用户在聆听的内容是基本连续的。就是这么简单的道理,促成了网络上的又一个传奇。
由于Real Media是从极差的网络环境下发展过来的,所以Real Media的音质并不怎样,包括在高比特率的时候,甚至差于mp3。特别是有相当长的一段时间Real Networks公司只顾着往Real Media里面加入各种各样的新特性比如广告插播什么的,而忽略了随着网络速度的提升和宽带网的普及,用户对质量的要求也不断提高。后来Real Networks通过与SONY公司合作,利用SONY的ATRAC技术(http://www.minidisc.org/,也就是MD的压缩技术)实现高比特率的高保真压缩,但这些举措始终都带给用户一个姗姗来迟的感觉。由于Real Media的用途是在线聆听,并不适于编辑,所以相应的处理软件并不多。一些主流软件可以支持Real Media的读/写,可以实现直接剪辑的软件是Real Networks自己提供的捆绑在Real Media Encoder编码器中的Real Media Editor。但功能非常有限。这一点与现在的Windows Media相比是两个世界。
在音频文件中,文件的长度至关重要。Windows Media承诺用更小的文件产生比MP3更好的音质;RealNetworks则着手把G2格式替换成更具有带宽自适应能力的RealAudio 8。
RealAudio的主要的不利之处是,大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。
RealNetworks推出了Real Audio 8,并声称新格式不光能在64Kbps速率下提供CD音质的声音,而且也为网上电台省钱,因为它能以较窄的带宽产生与G2相同的音质。
其中的一种:RM格式是RealNetworks公司开发的一种新型流式视频文件格式,RM格式一开始就定位在视频流应用方面,也可以说是视频流技术的始创者。它可以在用56 K Modem拨号上网的条件下实现不间断的视频播放,当然,其图像质量和MPEG2,DIVX等相比有一定差距,毕竟要实现在网上传输不间断的视频是需要很大带宽的。
在超过800个网站(如Amazon)上销售这些歌曲
Liquid Audio 文件格式
唱片公司或作曲家可以把他们的歌曲做成Liquid Audio的安全LQT(Liquid Track)格式,然后在超过800个网站(如Amazon)上销售这些歌曲。消费者可以下载免费的段落,或以每首1~2美元的价格买下来并在免费播放器Liquid Player 5 ( http://www.liquidaudio.com)上听。Liquid Player 5能够在CD-R上刻录音轨,制作出可在其他CD机上播放的CD来。你甚至可以利用一个特殊的文件在其他的电脑上播放你的LQT文件。
LQT文件采用了压缩格式,不过因为安全方面的原因,它要比MP3文件大些。不管怎么说,它提供了CD音质的音乐,在听音乐的同时可以看到文字、图片或是歌词。
Optical Disc Formats
今天的光盘,如DVD可以存储海量的信息,包括更宽广的音域及更多的声道(环绕音响)。
你可能对红皮书格式已经非常熟悉,甚至你自己还不知道——那就是16-bit、44.1KHz的格式,即音乐CD用到的CD-DA (Digital Audio,数字音响)。HDCD(high-definition compatible digital)在兼容的播放器上把采样精度扩展到20位。SACD (Super Audio CD)的采样精度是一位,而采样频率达到2.822MHZ。多延迟的DVD音频标准则有5个声道、24位、96KHz用来达到电影的环绕音响效果,或是有着双声道、24位、192KHz的常规的立体声。
其他竞争者都声称要超过MP3的音质、安全性及文件尺寸。索尼的ATRAC3 (Adaptive Transform Acoustic Coding 3)即是用于索尼内存棒式的随身听的一个压缩格式。Mjuice是一个加密的压缩的格式,可以通过截止期限等手段进行控制。AT&&T的专有压缩格式.A2B同样有防拷贝的加密功能。
除DRM特征之外,音频格式的另外一个趋势是附加内容,这一点在bluematter( http://www.bluematter.com/)格式中包含的内容中体现得尤其明显。时间会告诉我们那些数码音乐发烧友们是否会欢迎这些安全的格式所带来的附加的价值。
世界上第一个完全开放和免费的无损音频压缩格式
FLAC文件格式
FLAC即是Free Lossless Audio Codec的缩写,中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3 及 AAC,它不会破任何原有的音频资讯,所以可以还原音乐光盘音质。现在它已被很多软件及硬件音频产品所支持。
无损压缩FLAC简介
简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。
FLAC是免费的并且支持大多数的操作系统,包括Windows, "unix" (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。并且FLAC提供了在开发工具autotools, MSVC, Watcom C, 和Project Builder上的build系统。
FLAC项目包括以下几个方面:
数据流的格式
以库的形式提供的参考编码器和解码器
flac, 一个以命令行方式工作的可以编解码FLAC文件的程序(译注:有些象Lame吧?)
metaflac, 以命令行方式工作的FLAC文件的metadata编辑器
不同音频播放器的输入插件
我们所说的“FLAC是免费的”不仅仅意味着你可以不花钱而得到它。更重要的是FLAC的文件格式是对公众完全开放的,你可以以任何目的使用它(FLAC 项目只保留维护 FLAC 格式规格和确认兼容特性的权利),FLAC的文件格式和编码/解码的实现方式都不受任何已知专利的限制。还有,所有的源代码都在开放源代码的授权方式下可以得到。
FLAC是世界上第一个完全开放和免费的无损音频压缩格式。
FLAC的特性:
无损失压缩:被编码的音频(PCM)数据没有任何信息损失,解码输出的音频与编码器的输入的每一个字节都是一样的。每个数据帧都有一个当前帧的 16-bit CRC 校验码,用于监测数据传输错误。对整段音频数据,在文件头中还保存有一个针对原始未压缩音频数据的MD5标记,用于在解码和测试时对数据进行校验。
快速:FLAC更看重解码的速度。解码只需要整数运算,并且相对于大多数编码方式而言,对计算速度要求很低。在很普通的硬件上就可以轻松实现实时解码。
硬件支持:由于FLAC提供了免费的解码范例,而且解码的复杂程度低,所以FLAC是目前唯一获得硬件支持的无损压缩编码。
可以流化:FLAC的每个数据帧都包含了解码所需的全部信息。解码当前帧无需参照它前面或后面的数据帧。FLAC使用了同步代码和CRC(类似于MPEG等编码格式),这样解码器在数据流中跳跃定位时可以有最小的时间延迟。
可以定位:FLAC支持快速采样精确定位。这不仅对于播放有益,更使得FLAC文件便于编辑。
富于弹性的metadata:可以定义和实现新类型的metadata数据块,而不会影响旧的数据流和解码器的使用。目前已有的metadata类型包括tag,cue表,和定位表。 已经注册的应用程序可以定义自己专用的metadata类型(译注:这一点与MIDI标准相似)。
非常适合于存档应用:FLAC是一个开放的编码格式,并且没有任何数据的损失,你可以将它转换为你需要的任何其他格式。除了每个数据帧的CRC和MD5标记对数据完整性的保障,flac(译注:FLAC项目提供的命令行方式编码工具)还提供了一个verify(校验)选项,当使用该选项进行编码的时候,编码的同时就会立即对已编码数据进行解码并与原始输入数据进行比较,一旦发现不同就会退出并且报警提示。(译者:怎么样,这样压缩出来的东西还有什么不放心的?)
便于对CD进行备份:FLAC有一个“cue表”metadata数据块用于保存CD的内容列表和所有音轨的索引点。你可以将一张CD保存到一个单一文件,并导入CD的cue表格,这样一个FLAC文件就可以完整地记录整张CD的全部信息。当你的原来的CD损坏的时候,你就可以用这个文件恢复出与原来一模一样的CD副本。
抗损伤:由于FLAC的帧结构,使得一旦发生数据流的损坏,损失会被限制在受损伤的数据帧之内。一般只是会丢失很短的一个片段。而很多其他无损音频压缩格式在遇到损伤的时候,一个损伤就会造成后面所有数据的丢失。
FLAC不具有的特性:
数据缩水。FLAC是专门并且仅仅为无损压缩而设计的,您可以选用许多其他优秀的有损压缩方式如Vorbis, MPC, 和MP3(LAME提供了一个优秀的开放源代码的实现)。
SDMI(例如cetera)兼容。FLAC不准备支持任何复制保护方法,实际上这些手段最终都是在浪费数据。(从另一个角度看,由于所有这些手段最终都被证明是无效的,所以也可以说FLAC把这些无用数据压缩到了零!)当然我们不能阻止某些人利用专用的metablock进行复制保护,但是他们的保护只会在他们自己解码产品上有效,其他解码器会跳过这些专门的metablock的
适合那些拥有一对“金耳朵”并且一直对mp3的音质耿耿于怀的音乐发烧友
Monkey's Audio文件格式
Monkey's Audio(http://www.monkeysaudio.com)是一种无损压缩技术。他并不是由什么大公司发明的,完全是一个个人业余兴趣作品。为了使Monkey's Audio能有更好的发展,现在这个软件已经公开了源代码。
这种压缩格式的特点是无损压缩,也就是说对压缩数据进行还原之后得到的数据与原来的数据是完全相同的。该格式的特点尤其适合那些拥有一对“金耳朵”并且一直对mp3的音质耿耿于怀的音乐发烧友。后者有人会问,要无损压缩,我随便找个压缩软件比如WINRAR都可以达到不错的效果了,还要这种格式干嘛?所以这里要澄清一个误解:使用普通的压缩软件进行压缩无疑是可以得到不错的压缩效果,有时候甚至更优于使用Monkey's Audio,但是压缩软件生成的压缩包必须要先解压还原之后才能播放里面的内容,而Monkey's Audio这种无损压缩编码得到的文件可以直接使用播放器(比如WinAMP)进行播放。Monkey's Audio的压缩效果大约在2:1左右,也就是说压缩结果是原来的二分之一大小。一张CD大约需要330MB左右的空间存放,相比之下还是比较占空间的。由于这个原因,所以对音质要求不是太高的人通常都选择VBR方式的mp3而不是选择它。
与Monkey's Audio类似的编码格式还包括WavPack、RKAU、Shorten等等。由于相对不是那么出名,又或者在某些方面不够Monkey's Audio做得好,因此获得的关注程度就逊色很多。
Apple公司开发的一种音频、视频文件格式
MOV文件格式
它是Apple公司开发的一种音频、视频文件格式。QuickTime用于保存音频和视频信息,现在它被包括Apple Mac OS,Microsoft Windows 95/98/NT在内的所有主流电脑平台支持。QuickTime文件格式支持25位彩色,支持领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。它无论是在本地播放还是作为视频流格式在网上传播,都是一种优良的视频编码格式。QuickTime因具有跨平台、存储空间要求小等技术特点,得到业界的广泛认可。
同是Apple公司开发的
Qtm文件格式
动画文件,这种文件格式是由Apple计算机公司开发,被Apple Macintosh和Microsoft Windows平台所支持,支持25位颜色,最大图像分辩率是64000*64000,支持压缩,用于保存音频和运动视频信息。
VOC文件格式
Voice文件是新加坡著名的多媒体公司Creative Labs开发的声音文件格式,多用于保存Creative Sound Blaster系列声卡所采集的声音数据,被Windows平台和DOS平台所支持,支持CCITTA Law和CCITTμLaw等压缩算法。在DOS程序和游戏中常会遇到这种文件,它是随声卡一起产生的数字声音文件,它与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
VOB文件格式
vob文件用来保存所有MPEG-2格式的音频和视频数据,这些数据不仅包含影片本身,而且还有供菜单和按钮用的画面以及多种字幕的子画面流。.ifo文件用于控制VOB文件的播放,在这个文件中可以找到如何控制.vob文件中数据播放的信息。由于.ifo文件对光盘能否正常播放至关重要,因此将所有的.ifo文件都保存了一份副本,即同名的.bup文件。在每个DVD光盘中都有视频管理器(VMG),它存放在VIDEO_TS.ifo文件中,保存了光盘的全局信息,如光盘可以在哪个地区播放等。同时,光盘还将用于显示菜单的数据保存在VIDEO_TS.vob文件中,当光盘插入到光驱中时播放器会首先显示这个菜单,大多数菜单可让观众指定场景、选择语言字幕等。
为了打破微软ASF的种种协定的束缚
DIVX文件格式
DIVx视频编码技术是为了打破微软ASF的种种协定的束缚,由Microsoft mpeg4v3修改而来,使用MPEG-4压缩算法。播放这种编码的视频,对机器的要求不高,CPU只要是300 MHz以上、64 M内存和一个8 M显存的显卡就可以流畅地播放了。采用DivX的文件小,图像质量高,一张CD-ROM可容纳120 min的质量接近DVD的电影。
一种源自剧院模式开发的数码环绕声
DTS文件格式
DTS为 Digital Theatre System的缩写,即数码影院系统。它是1996年底推出的一种源自剧院模式开发的数码环绕声系统。我们知道杜比实验室的AC-3也是一种出色的一种杜比环绕声模式,它是利用全频模式播出五一国际劳动节声道,即前主音箱、后环绕音箱以及中置和重低音各自独立运行,但该声音效果是横向定位环绕,其音响效果自有公论。DTS系统不仅具有 AC-3 相似功能,更加强了其纵深定位交叉效果。DTS 芯片容量为 1536kbps,压缩传输比为 4:1;而 AC-3芯片容量为 448kbps,压缩比为 10:1。正是由于DTS 信息容量的增加,音色更加优美,不但可以聆听 Hi-Fi音乐,同时也可以欣赏爆棚影视软件。 由于DTS 以 20bit 在 48kHz 的频率中工作,提供 6声道信息,它所创造出的音域环绕声效果,能满足众多AV 发烧友最挑剔的要求。听音者完全被这种气势所包围,真正体验360度数码环绕音响效果。我们经常说的什么"6点1"就是指的DTS,它所带来的震撼效果是AC-3无法比拟的。 DTS 家庭影院的核心是DTS 解码器,它可对 DVD,CD 的杜比数字解码,输出 五一国际劳动节声道信息,也可以选择DTS方式,输出6 声道信息。DTS和杜比数字在音质上有着明显的不同,前者声音力度强劲,声音的上升和切入都很尖锐,音场的透明感清晰可闻,尤其是丰富的低音效果表现得更加激烈火爆。后者在低音方面缺少丰富的力度,声音的上升和切入就显得有些暧昧。也就是说DTS在某些细节和分辨力方面比AC-3还略胜一筹。它的另一个特苤胤臶烧友[/非蟮HDCD,这就意味着DTS的声音表现能显著地超越目前任何最好的CD录音。目前市面上已经有不少DTS格式的CD出品了。 从技术上讲,DTS与包括DolbyDigital在内的其它声音处理系统是完全不同的。DolbyDigital是将音效数据存储在电影胶片的齿孔之间,因为空间的限制而必须采用大量的压缩的模式,这样就不得不牺牲部分音质。DTS公司用一种简单的办法解决了这个问题,即把音效数据存硗獾腫-ROM中,使其与影像数据同步。这样不但空间得到增加,而且数据流量也可以相对变大,更可以将存储音效数据的CD更换,来播放不同的语言版本
单独把手机铃声拉出来
手机铃声格式
现在,手机铃声已经成为手机功能的一个重要表现部分,甚至有很多朋友把它作为自己购买手机的第一标准。从最早的单音铃声到现在顶级的72和弦铃声,更有MP3歌曲铃声和真人发音铃声.
铃声的种类可谓是多种多样,而铃声现在也已经以成为众多手机玩家的必玩之物,休闲之余便会自编、自录或下载几首动听悦耳的音乐、声音来个性一下自己的爱机,犒劳一下自己和别人的耳朵!
看透铃声格式!
在手机支持和弦数不断增加的同时,手机所支持的铃声格式也越来越多。目前主流的手机铃声格式有MMF、MIDI 、WAV、 AMR、 MP3、 IMY、 RTTL、 M3U、 AAC等。其中MMF和MIDI是目前手机上支持最多的格式;而过去的单音铃声手机大多数采用的是IMY和RTTL格式。
(1)MMF格式
MMF(Application Fprmat)和SMF(MIDI)等格式的铃声相比,优点是文档小、音乐表现力强。另外,MMF格式是资源最丰富的铃声格式,在网上我们很容易就可以找到。MMF铃声格式是YAMAHA推出来的,与其铃声芯片相匹配的格式,并且分MA1(4和弦)、MA2(16和弦)、MA3(40和弦)、MA5(64和弦)几种。所以上传时一定要知道自己的手机支持哪种。有很多网友只知道MMF是铃声文件,并不知道自己的手机支不支持。要知道,MMF是日韩系手机主流格式,欧系手机大多不支持(NOKIA、阿尔卡特等)。
(2)MIDI格式
MIDI(Musical Instrument Digital Interface MIDI-sequention Sound)是SMF(标准的MIDI文件)的多媒体数据形式,它就像交响乐团用的乐谱一样,只记录在何时使用什么乐器,以及越长、音调的信息。MIDI信息所占空间比较小,非常适合在手机中使用,但其最大的缺点就是声音的音量较小,不过现在可以在网上找到一些软件进行调节。
(3)AMR格式
AMR(Adaptive Multi-Rate)是一种应用在手机上的一种语音压缩格式,也就是说我们用手机录音而成的文件就是这种格式的。AMR格式压缩率较高但是音质相对较差了一点。优点就是我们可以随心所欲地录制。
(4)WAV格式
WAV(Waveform Audio)是一种标准的声音文件格式,但与其它的压缩格式的文件比起来,占据的存储空间较大,不过在音质方面就非常的出众,如果你的手机内存足够大的化它还是很有使用价值的。
(5)MP3格式
MP3(MPEG Layer 3)做手机铃声虽然是最近才开始流行的,不过想必大家对它都已经很熟悉了吧,摩托罗拉E398、索尼爱立信K700c、诺基亚6230等等都是很好的“MP3播放器”。MP3是由ISO/MPEG语音编码标准(Audio Coding Standard)所制定的一种声音的压缩技术,使用这种技术可以将一般未压缩的音乐数据压缩至1:10到1:12大小,而且保持在人耳几乎无法分辨出来的失真率。不过相对手机产品来讲,MP3所占的内存空间仍然不小,因此支持这种音乐(铃声)格式的手机一般都具有比较大的内存空间或可以进行外部内存扩展的。
(6)IMY格式
iMelody(iMelody Ringtone Format)简称为IMY格式,这可是过去爱立信公司的看家铃声格式。同样它也具有占有空间小、容易编辑等特点,因此曾被EMS(增强型短信)作为铃声标准。
(7)RTT格式
RTTTL(Ringing Tones Text Transfer Language)是诺基亚系列手机常用的铃声格式,它能自动将MIDI包含的多个音轨转化成简谱显示,并可以随意地修改、删除音符。使用RTTTL的好处是它以纯文字格式储存,传送及修改都很方便,但不好的地方就是不能即时试听。
(8)Ogg格式
Ogg Vorbis 是一种音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的音乐格式。但有一点不同的是,Ogg Vorbis格式是完全免费、开放源码且没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放源码的多媒体系统。开放源代码能为用户在经济上带来收益,这一点很多人都知道了,但不能忘记的是Ogg Vorbis的技术也不是盖的。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常灵活的。它的最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。在压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和ABR(平均比特率)方式进行编码。与MP3的CBR(固定比特率)相比可以达到更好的音质。Ogg Vorbis其他技术特性还包括:支持类似于MP3的ID3信息,但比MP3要灵活而又完整得多,实际上可以填写随意多的信息。Vorbis还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。Vorbis文件可以被分成小块并以样本粒度(granularity,专业术语,指数据可以被分割的最小尺寸)进行编辑;Vorbis支持多通道(大于2)音频流并使用了独创性的处理技术;Vorbis文件可以以逻辑方式相连接等。可以这样说,Ogg Vorbis在业界的支持是非常广泛的。简单的举个例子,著名的游戏闪点行动(Operation Flash Point)就是使用Ogg Vorbis作为游戏所有声音和音乐的保存格式的。
“边缘”文件格式(一)
简单介绍几种可以执行的文件格式
bat文件格式
在MS-DOS中,.bat文件是可执行文件,批处理文件,有一系列命令构成,其中可以包含对其他程序的调用。Autoexec.bat为自动批处理文件,它是特殊的批处理文件。
EXE文件格式
可执行的程序文件,与COM内部结构不相同,最突出是长度没有限制。
COM文件格式
可执行的二进制代码系统程序文件,特点非常短小精悍,长度有限制。
Dll文件格式
DLL文件即动态链接库文件,是一种可执行文件,它允许程序共享执行特殊任务所必需的代码和其他资源。Windows提供的DLL文件中包含了允许基于Windows的程序在Windows环境下操作的许多函数和资源。
DLL多数情况下是带有DLL扩展名的文件,但也可能是EXE或其他扩展名。它们向运行于Windows操作系统下的程序提供代码、数据或函数。程序可根据DLL文件中的指令打开、启用、查询、禁用和关闭驱动程序。
DLL是Dynamic Link Library的缩写,意为动态链接库。在Windows中,许多应用程序并不是一个完整的可执行文件,它们被分割成一些相对独立的动态链接库,即DLL文件,放置于系统中。当我们执行某一个程序时,相应的DLL文件就会被调用。一个应用程序可有多个DLL文件,一个DLL文件也可能被几个应用程序所共用,这样的 DLL文件被称为共享DLL文件。DLL文件一般被存放在C:\Windows\System目录下。
Bin文件格式
二进制文件,其用途依系统或应用而定。
其他一些文件格式
边缘文件格式(二)
早期的操作系统所使用的帮助文件系统
HLP文件格式
HLP文件格式是早期的操作系统所使用的帮助文件系统。这种格式对读者的操作系统没有太多要求,Windows 95及以后的版本都可以运行。现在很多运行于Windows平台的软件,其帮助文件几乎都是HLP格式的。当然,随着微软CHM帮助文件系统的推出和操作系统的发展,HLP文件格式很可能会被CHM所代替。
HLP文件格式的不足之处是美观程度不够好。这种格式的电子读物制作简单、获取方便、对阅读者无需特别的要求。另外,目前很多软件的帮助文件还是使用这种格式
基于HTML文件特性的帮助文件系统
Chm 文件格式
CHM文件格式是微软1998年推出的基于HTML文件特性的帮助文件系统,以替代早先的WinHelp帮助系统,在Windows 98中把CHM类型文件称作"已编译的HTML帮助文件"。被IE浏览器支持的JavaScript、VBScript、ActiveX、Java Applet、Flash、常见图形文件(GIF、JPEG、PNG)、音频视频文件(MID、WAV、AVI)等等,CHM同样支持,并可以通过 URL 与Internet联系在一起。常用于制作帮助文件和电子文档。
Doc文件格式
是目前市场占有率最高的办公室软件Microsoft Office中的字处理软件Word创建的文档。
Rtf文件格式
丰富文本格式文件,以纯文本描述内容,能够保存各种格式信息,可以用写字版,Word等创建,QQ的网络记事本就用的这格式。
Tmp文件格式
临时文件,一般是系统和应用程序产生的临时使用的文件,当系统和应用程序退出时,会自动地删除其建立的临时文件,如果是非正常退出,临时文件可能保留在磁盘上,在单任务系统下,可立即删除它们,在多任务系统下,应删除那些不是正在使用的临时文件。
Qpx文件格式
查询文件,在Dbase,Foxbase,Foxpro系列软件的环境下使用。
CAB文件格式
Microsoft制订的压缩包格式,常用于软件的安装程序,使用Windows自带的实用程序,Extract.exe可以对其解压缩,WinZip,WinRAR等都支持这种格式。
参考文献资料:
[1]:http://www.ccidnet.com/html//tech/mmed/2001/01/09/58_1559.html
(作者:徐建国2001年01月09日 19:41声音文件格式漫谈)
[2]:林福宗主编.图像文件格式大全.北京:清华大学出版社,1998年.
[3] H.M.Deitel, P.J.Deitel, J.Listfield, T.R.Nieto, C.Yaeger, M.Zlatkina著.葛昊晗,汤涌涛,李强等译.C#大学教程:第16章 图形和多媒体.北京:清华大学出版社,2003年11月.
[4] 霍宏涛主编.数字图像处理.北京:北京理工大学出版社,2002年9月.
[5] 边肇祺,张学工等编著. 模式识别(第二版). 北京:清华大学出版社,2000.
[6]一些是从网络上的通过google和baidu搜索到的