MPEG的层次
MPEG是‘Moving Picture Experts Group’的简称,在它之前的标准叫做JPEG,即‘Joint Photographic Experts Group’。当人们用到常见的‘.jpg’格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG标准扩展到了运动图象。
MPEG的各种压缩方法,以及这些压缩方法的使用领域。最初的MPEG标准,即MPEG-1,是用于VCD的,而它的音频压缩格式就是大家熟悉的MP3格式,这种MP3格式规定了与视频压缩相分离的音频压缩方法。MPEG-1的特点是双声道(立体声),而且MPEG-1标准被包含在其他的MPEG标准中。它的压缩技术包括“DCT(离散余弦变换)”等其他一些压缩技术。MPEG-1包含了I帧、P帧和B帧的概念,这与MPEG-2是一样的。
MPEG-2
MPEG-2是MPEG-1之后的标准,是与MPEG-1向后兼容的,但同时又增加了几个新的内容,这包括5.1声道环绕声,即除了左右声道外还加有中央声道、左后声道和右后声道,以及一个低频增强声道,前面的5.1中的.1就是指这个低频声道。MPEG-1包含了构成一幅图象所需的全部元素,这些元素构成了所谓的‘系统流(system stream)’。在MPEG-2中,系统流被重新命名为‘节目流(program stream)’,节目流还规定了传输流(transport stream),用于容易出错的媒体。节目流同时还增加了数字电视的服务内容。MPEG-2是一种同时适用于空间传送与电缆传送的MPEG标准。
MPEG-4
目前存在许多的MPEG标准,每一个标准都是建立在前面的标准之上的,并与前面的标准保持向后兼容。MPEG-3原来打算用作MPEG-2的高清晰度电视(HDTV)标准,但HDTV实际上被并入到MPEG-2中,所以也就不存在MPEG-3这个标准了。
MPEG-4是在MPEG-2基础上作了很大的扩充,主要目标是多媒体应用。在MPEG-1和MPEG-2中,我们的观念是单幅图象,而且包含了一幅图象的全部元素。在MPEG-4标准下,我们的观念变为多图象元素,其中的每一个多图象元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图象。
MPEG-4解码器的概念,而且比较清楚地描述了每个部件的用途。这里不是使用单一的视频或音频解码器,而是使用若干个解码器,其中的每一个解码器只接收某个特定的图象(或声音)元素,并完成解码操作。每个解码缓冲器只接收属于它自己的数据流,并转送给解码器。复合存储器完成图象元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然的不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。
MPEG-4标准对自然元素(实物图象)和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图象可以包含一幅实际的背景图,并在前面有一幅动画,或者有另一幅自然图象。这样的每一幅图象都可以作最佳压缩,并互相独立地传送到接收器。接收器知道如何把这些元素组合在一起。
如果用MPEG-2标准,图象就被看作一个整体来压缩;而在MPEG-4标准下,对图象中的每一个元素进行优化压缩。静止的背景不必压缩到以后的I帧之中去,否则会使带宽的使用变得很紧张,而如果这个背景图象静止10秒钟,就只需要传送1次(假设我们不必担心有人在该时间内切入此频道),需要不断传送的仅是前台的比较小的图象元素。对有些节目类型,这样做会节省大量的带宽。
MPEG-4对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器。在MPEG-1和MPEG-2的标准下,我们就必须先把独唱与合成器作混合,然后再对合成的音频信号进行压缩与传送。在MPEG-4标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口(MIDI)的声轨信号,就可以使接收器重建伴音。当然,接收器必须能支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其他的节目类型同样可以作类似的规定。
MPEG-7
MPEG-7的正规的名字叫做‘多媒体内容描述接口’,其目的是生成一种用来描述多媒体内容的标准,这个标准将对信息含义的解释提供一定的自由度,可以被传送给设备和电脑程序,或者被设备或电脑程序查取。MPEG-7并不针对某个具体的应用,而是针对被MPEG-7标准化了的图象元素,这些元素将支持尽可能多的各种应用。建立MPEG-7标准的出发点是依靠众多的参数对图象与声音实现分类,并对它们的数据库实现查询,就象我们今天查询文本数据库那样。
MPEG-21
如果上面这些MPEG标准还不够用,那么制订新标准MPEG-21的工作已经开始。MPEG-21标准用来定义一种多媒体框架,将把现有的各个标准融合起来,并在有必要时建立新的标准。
小波技术(Wavelets)
小波技术是图象压缩的另一个途径。与DCT(用于JPEG和MPEG的有损压缩技术)相比,在同等图象质量的前提下,小波技术一般要求较低的带宽,虽然它也是一种有损编码。它被建议用于下一代JPEG编码,这个JPEG叫做JPEG-2000。
在小波压缩中,一幅图象被分解为若干个叫做‘小片(tile)’的区域。在每个小片中,图象经滤波后被分成若干个低频与高频分量。图象滤波可以是一维的,但一般是两维的。图象在送入低通与高通滤波器后就得到低频与高频分量。
低频分量可以用不同的分辨率进行量化。也就是说,图象的低频部分需要许多的二进制位,以改善图象重构时的信噪比,所以低频元素采用精细的量化。高频分量(边缘)可以量化得比较粗糙,因为你不大容易看到变化区域的噪声与误差。这样被量化的子带(sub-band)可以有许多,不只是高频、低频两个子带。
碎片技术(Fractals)
碎片技术已经作为一种压缩方法被提出。这种技术依靠实际图形的重复特性。用碎片技术压缩图象时需要占用大量的计算机资源,但可以获得很好的结果。碎片技术已经用于计算机生成图象。电影‘阿波罗13’中月亮图象就很明显地运用了此技术。■(剑清)
摘自《电子产品世界》