多媒体通信网

发布时间:2005-03-16 作者:毕厚杰Bi Houjie 阅读量:

众所周知,近百年来,电话通信给人们以很大的方便,但这仅仅给人们带来了听觉信息。随着科学技术的迅猛发展,今天,多媒体通信已获得很大的进步。这种通信所传送的信息就不仅仅是听觉信息,还包括视觉信息以及文字、图形等数据信息(从广义上说,它们也都可称为数据信息)。多媒体通信即以远程服务的方式,把媒体信息送到多媒体应用的用户终端,如会议电视、合作工程、邮递系统等。

     下面首先简要介绍一下其主要的应用与服务。

 

1 应用与服务

 

1.1 交互服务

    收发器之间的通信可以是同步方式或异步方式。前者意味着数据以众所周知的端——端时延从发端到达收端,后者则数据可以在任何时间到达。如会议电视采用同步通信方式,这时远方的会议参加者都同步地观看着某一发言人;邮递系统则采用异步方式。交互服务又可进一步分成以下各项。

(1)会晤服务

     会晤服务支持相隔很远的用户之间的会晤。这种服务利用收发方之间的通信连接,多媒体信息的双向传送采取同步方式。其特征是信息的实时传递。数据必须尽快地在两个方向被传递,即端——端时延必须最小,使得用户之间的会晤可以实时地进行,不致干扰会晤时人们的感觉,例如会议电视、可视电话等等。

(2)消息服务

    收发端之间交换消息采取异步方式,因此只要用户终端希望传送消息就可传送,但并不需要快速传送,即不需最小的端——端时延,例如传送一封信、一张照片等。

(3)回送服务

     这时发送器(也称客户)是一个用户(人),而接收器(即服务器)则是一个带有数据库的计算机,客户要求得到由存有信息的服务器来的信息,而服务器则回送该信息给客户(原发端)。

     从客户到服务器的通信是异步的。因为这时并无时间上的限制,从服务器到客户的通信视回送信息的类型而定,可以是同步,也可以是异步。例如点播电视(VOD),客户需要从远方服务器得到电影节目,于是视频和音频的回送就应有严格的时间限制,即取同步方式。如回送的是文件,则可异步。

(4)远程工作服务

    它又包括诸如事务处理、告警和监视、商业自动化等多种应用与服务。

 

1.2 分布服务

    分布式服务是用于把信息送到分布在不同的远方各点的服务。它们是由广播信源到远方各接收点的单向通信,如TV广播或无线电广播就采用分布式服务。分布式服务又有两种子服务:没有个别用户控制和有个别用户控制的分布式服务。这些服务正在向交互服务方向发展。

(1)收费电视

    利用机顶盒的解调、解密、解压缩,电视机用户可收到收费电视节目(加密的广播数字电视)。

(2)准按需电视(NVOD)

    该服务可由许多信道广播网节目获得。在这些信道之间有一个固定(例如10分钟)的时间延迟。用户只要适当改变信道,可模拟正向和反向功能。

   综上可见,多媒体通信涉及人们的工作、生活、学习各个方面,应用十分广泛,它的迅速发展也将对国民经济的发展起重要作用。

 

2 对多媒体通信网的要求

 

2.1 信道应有足够的带宽

    多媒体信息中包括视频信息,而视频信息包含了大量的信息,即具有较宽的带宽,例如高清晰度电视(HDTV)本身如不加压缩,应具有1 000Mbit/s以上的带宽;又例如,话音信息如不加压缩,也需要64kbit/s。为了基本不失真地传送这些信息,信道本身就应该有足够的带宽。

    于是出现了不少宽带网络,最理想的就是光纤网络。但由于光纤网络、光端机等目前所需费用还相当昂贵,于是出现了充分利用电话铜缆资源的不对称数字用户线(ADSL)、充分利用有线电视(CATV)网络资源的多媒体宽带网络等等。

 

2.2 对信源信息必须进行数据压缩

    由于多媒体通信的信息量大,为了节约传输费用,就必须进行数据压缩。例如HDTV压缩后,可降至20Mbit/s,即压缩为原码率的1/50,如果传输费用与码率成正比,则使传输费用降为原来的1/50。因此,对多媒体通信网而言,数据压缩是一个十分重要的问题。

 

2.3 服务质量(QoS)

    通信的服务质量在长期以来的电路交换模式中,应该说是基本有保证的。因为一旦通信呼叫成功,收发之间建立了专门的通信连接,别人就无法插入。现在,由于数据业务的迅速发展(数据业务年增长率为30%,而话音业务仅为5%),分组交换,即IP技术的发展很快。这种IP技术的优点是连接方便,数据包头中带有目的地的IP地址,通过一个个路由器,就可很方便地把该数据包传送到目的地。这种方式的网络资源利用率高,但也有不足之处,由于路由器的时延,而IP网是许多用户公用的,QoS很难保证,当业务流量猛增时,网络带宽会严重不足,信道会出现不畅,甚至阻塞现象。

    因此,怎样保证通信的服务质量是一个严重的问题。人们已提出了一系列的技术措施,包括采用一些保证QoS的通信传输协议,如资源预留协议(RSVP)、实时传输协议(RTP)、实时传输控制协议(RTCP)等等。在传输技术上采用ATM加IP技术如多协议标记交换(MPLS)。

 

2.4 同步技术

    在多媒体通信网中,多种不同性质的媒体在同一个网络中传送,因不同信息的传输与处理需要有不同的时延,于是产生了媒体之间的同步问题。

    为了解决多媒体信息的同步,需要采取一些技术措施。例如在H.261编码器中,视频压缩编码需要较长时间,而伴音的压缩编码只需较短时间。为解决“唇音同步”问题,往往在音频编码器之后人为地附加一个时延。此外,还可采用时间戳方法、同步标记法等等。

 

3 数据压缩

 

    下面分别对常用的编码技术及数据压缩国际标准作一简要介绍。

 

3.1 熵编码

     这是一种无损编码,如Huffman编码,根据不同组合的数据出现的不同概率分别用一事先编制好的码表示,对经常出现的数据用短码表示,不常出现的数据则用长码表示。理论证明,这时可获得平均最短码长,实现了数据的无损压缩。信源编码则是有损编码,这种方式解码后不能完全恢复原数据。多媒体通信中常采用这两类基本编码混合组成的混合编码。

 

3.2 变换编码

    该变换是将数据从一个域(例如时域)变换到另一数学域中,以便更适于压缩。该数学的反变换必须存在,以便基本恢复原数据。最常用的是快速付里叶变换(FFT)。它把数据从时域变换到频域。图像压缩中最有效的变换则是离散余弦变换(DCT)。离频域中大量系数为零或接近零,可大大压缩图像数据。

 

3.3 预测编码(DPCM)

    也称差分编码。如果有一个文字序列,前后邻近的文字之差并非零,但和零相比差不了多少,在这种情况下,传送当前值与前一值之差,显然对数据压缩是十分有利的。这种方法之所以对图像压缩十分有利是因为图像像素之间往往十分相似,邻近像素质之差非常小,于是利用预测法只需用很少的比特就可传送各像素值了。例如可视电话中,由于邻近帧的背景差别不大,脸的活动动作也不大,因此邻帧之差别不大,大多为零,就可用预测编码。基于两帧之差还可用一个运动矢量表示。当某一运动物体适当移动一个位置后,则前后帧图像就极为相似了。这叫运动补偿技术,可进一步提高预测精度,从而提高压缩比。

 

3.4 JPEG

     1992年,国际标准化组织(ISO)公布了静止图像压缩的标准,即JPEG。下面只介绍JPEG的基本系统原理。

     基本系统输入图像的精度为8bit像素,这是一种顺序建立方式的有损编码。

     首先,整幅图像被划分为许多互不重叠的8×8像素方块,然后对各方块进行DCT变换,变换后共64个系数,其中一个为直流系数,另63个为交流系数。接着对所有系数进行量化。量化步长是根据视觉心理实验得到的。

     量化后,将当前方块的直流系数与上一个方块的直流系数之差值进行熵编码以压缩数据。这是由于直流分量是子块的平均值。各相邻子块的相关性很强,即其平均值差别很小,为保证各子块的平均值无明显跳跃,取无失真的熵编码是合适的。对于交流系数,量化的系数仅少数系数不为零,因而采用“之字形”方式进行一维扫描,然后将非零系数前面的“0”的个数(被称为游程长度)和该系数值一起作为统计事件进行Huffman编码。在基本系统中共推荐了两组Huffman码表,一组用于亮度信号Y,另一组用于色度信号U、V。每一组表又包括直流与交流系数两张表。不同的(游程表、系数)组合,出现的概率不同,就用不同的码代表。凡是经常出现的组合,就用短码表示,反之则用长码表示。

 

3.5 H.261

     1990年,IUT-T通过了“H.261 p×64kbit/s视听业务用的视频编解码”建议,其中p=1,2,…30。H.261采用的是混合编码法,即帧间预测(采用DPCM)与帧内变换(2D-DCT)相结合。若前后两帧很相似,则编码器取帧间预测方式,然后对所得的帧间预测误差进行二维离散余弦变换;若前后两帧不很相似,则对该当前帧图像进行帧内DCT变换,即把该帧图像中每一个8×8方块进行DCT,接着对其系数量化,然后是变长编码(VLC)。

 

3.6 MPEG

     MPEG是“活动图像专家组”的简称,主要任务是制定活动图像及相应声音的压缩编码标准。目前已制订了MPEG-1、MPEG-2及MPEG-4标准。下面只对MPEG-1、MPEG-2作简要介绍。

(1)MPEG-1

     MPEG-1标准于1990年11月由ISO正式公布,用于高至1.5Mbit/s的数字存储媒体的活动图像和相应的音频编码。该标准由3部分组成:MPEG系统、MPEG视频和MPEG音频。

    MPEG-1系统是将压缩后的视频、音频及其它辅助数据组成字长为188字节的分组(包),在每个分组的字头设置时间标志,以便在解码器中保证图声同步,便于节目编辑,便于用户在使用中搜索、快进、快倒、慢放等。

    MPEG-1音频部分规定了音频编码技术,子带滤波器将输入的数字音频信号分成32个子带,根据人耳的掩蔽效应确定掩蔽门限,结合人的听觉特性,据此自适应地分配比特,以便高效压缩音频数据。这是一个高保真的音频编码标准。

     视频编码原理与H.261类似,但略有不同。两者主要差别在于引入了双向运动补偿。视频序列的划分包括图像序列(GOP)层、图像(帧)层、条层、宏块层和块层等。每个GOP中第1帧为帧内编码,称为I图(帧内图)。GOP中第M、2M、3M帧采用类似H.261的预测编码方法,称其为P图(预测图)。剩余的其它帧称为B图(双向预测图),对它们进行双向运动补偿。这样,处理顺序为0号→3号→1号→2号→…→下一个GOP的I图(即第0号帧),即并非按自然数的帧号顺序处理的。

    MPEG-1主要用于CD-ROM,也可用于传输。实验表明,MPEG-1压缩在1.2Mbit/s时,编解码后的视频图像质量是良好的,相当于VHS水平。

(2)MPEG-2

   1994年,由ISO正式公布了MPEG-2,它是通用的声音和图像压缩编码标准。

    和MPEG-1类似,MPEG-2也有3种图像类型,即I、P和B图。它追求的是高质量的图像,码率在3Mbit/s以上。在编码方法上与MPEG-1的主要区别在于对隔行视频的处理方式上。对于场/帧运动补偿和场/帧DCT的选择,在MPEG-2中是改进图像质量的一个关键措施。

    MPEG-2标准也有3个部分,即系统、图像和音频。为了使MPEG-2适用于广泛的领域,并使不同应用码流能很快互换,规定了通用的压缩编码方法,视不同应用需要,把图像分成不同“档次”和“等级”。其压缩编码方法类似于MPEG-1,但在基于场还是基于帧的选择上是有重大区别的。将多声道扩展信息加到MPEG-1音频数据结构的辅助数据流中,于是声道数扩展到5.1,即3个前声道、2个环绕声道和一个超低音声道(常称之为0.1)。其压缩方法类似MPEG-1。

 

4 多媒体通信网的同步技术

 

4.1 多媒体通信的同步要求

    多媒体通信的同步作用,就是将有一定时间关系的不同媒体数据流经通信网络处理传输后,仍能保持原定时间关系。

    不同媒体经过处理、传输后,往往产生不同的时延,于是媒体之间的时间关系就发生了变化。多媒体通信的一个重要问题就是必须保持多媒体之间的同步。采取有效措施,消除或减少时延、抖动,使多媒体经过处理、传输后的同步误差控制在所能容忍范围之内,即保持处理、传输前各媒体之间的时间关系是十分必要的。

 

4.2 时间戳同步法

    发送时,将各媒体按时间顺序分成若干分组(包),给每个分组设置一个时间标记,即时间戳,就像信封上加盖具有发送时间的邮戳一样。在各媒体到达收端时,具有相同发送时间戳的媒体数据包同时被接收(表现),从而达到各媒体之间的同步。

    如果多媒体网络是同步通信网,即具有统一的网络时钟,则此时的时间戳具有绝对的时间标记,这叫绝对时间戳法。

   如果多媒体网络不是同步网,即没有统一的网络时钟,则可在多种媒体中选择一种作为主媒体,其它则为从属媒体。在主媒体上各分组按时间顺序打上时间戳,从属媒体则视哪个分组与主媒体的分组时间一致的,打上该分组的时间戳,这叫相对时间戳法。

    这种时间戳同步法,不用改变数据流结构,不需另外设置附加的同步信道,因此应用十分广泛。其缺点是发端选择相对时标和收端确定相同时间戳的操作比较复杂,需要一定的比特开销用于同步。在主媒体发生异常或丢失的情况下,都会导致其它媒体的不同步或丢失。

 

4.3 同步标记法

     发送时,在媒体数据流中加上同步标记(例如若干个连续“1”,这时没有时间的标记)作为发送的同步参考点,即各媒体在此同步参考点同时发出,接收时按接收到的同步标记进行同步处理。

(1)辅助同步信道法

     即原各媒体不加改变地在分离的信道上传输,与此同时,再增加一个并行的辅助信道,专门传送同步标记。接收时,先缓存各媒体数据流,直到到达了同步标记点,各媒体数据流才开始向外输出。

    这种方法的优点在于和现有通信协议的兼容性好,不改变原数据结构,因为它另设了一个辅助同步信道,也不需要同步时钟;缺点则是增加了同步线路。

(2)插入同步标记法

    发端在每个媒体流中插入同样的同步标记。每个媒体流通过不同的信道传输后,接收端先缓冲下数据流,直到各信道中同步标记都到达时,才同步输出各媒体数据流。

    这种同步方法操作比较简单,同步比特开销不大,无需网络的同步时钟,对现有网络协议改动较小,兼容性也较好。但它改变了数据结构,不能用于设备的直接连接,不适用于多媒体存取数据。

 

4.4 多路复用同步法

    将多个媒体流的数据复用到一个数据流中,从而使它们在传输中自然地保持着媒体间的同步关系。例如在分组交换网中用某一条多媒体虚电路(MVC)传送所有媒体复用的数据流供某个会议电视用。

     这种同步方式中,接收端无需重新同步,无需全网同步时钟,无需附加同步信道,因而实现比较简单,同步比特的开销也较小,可满足实时通信的要求。但其灵活性较差,无法满足不同层次的同步要求。如在分组网络中,当传输性能下降时,不能丢失一些相对不重要的媒体流(多种媒体流已复合在一起);不能处理来自不同信源的媒体流;由于多路复用,改变了数据流的结构,给设备的直接连通带来了困难。

     综上可见,各种同步方法各有不同的优缺点。由于各媒体流在传输性能上差异较大,为了达到同步,需建立具有不同QoS和传输控制的信道来传送各媒体数据流和同步标记信息。比较起来,以时间戳法的同步性能最好,尤其是相对时间戳同步法,可能是多媒体通信中的一个主要同步方法。

 

(收稿日期:1999-09-12)

[摘要] 文章首先对多媒体通信的应用与服务作了一个概括介绍,接着对多媒体通信网的要求,着重于带宽、数据压缩、服务质量以及同步技术进行了简要分析,最后对数据压缩特别是常用的图像压缩方法和标准以及同步技术作了扼要介绍。

[关键词] 多媒体通信 服务 编码 同步

[Abstract] The applications and services of multimedia communications are summarized first,followed by the analysis of requirements for multi-media communications network es-pecially on the bandwidth,data compression,QoS and synchro-nization techniques.Common meth-ods and standards for image data compression are introduced and fi-nally synchronization techniques are discussed .

[Keywords] Multimedia communications Service Encoding Synchro-nization