多媒体业务的现状及其发展趋势

发布时间:2003-11-26 作者:蒋林涛 Jiang Lintao 阅读量:

1 概述

  80年代初,美国、日本和欧洲著名的计算机公司开始致力于多媒体技术的研究, 把该技术应用于PC机。首先建立了基于局域网(LAN)的多媒体通信系统。进入90年代,企业的国际环境变得日益复杂,竞争日趋激烈,现代企业必须依靠很高的信息获取能力才能立于不败之地。对企业特别是大公司而言,在经营活动中,希望借助先进的通信系统达到缩短产品投放市场的时间,改善对用户的服务,减少差旅支出。对个人而言,由于生活环境日趋复杂,生活节奏越来越快,也希望能随时获取信息,并采用计算机支持协同工作(CSCW)方式来提高工作效率。未来的家庭需要远程购物、远程医疗、远程教育、游戏等来提高它的生活质量。上述的需求和希望,传统的通信系统无法满足,唯有多媒体系统才是解决的办法。

  多媒体技术已经谈了整整10年,10年来在多媒体技术的应用方面始终没有突破,其主要原因是承载多媒体业务的网络传输能力始终是一个瓶颈。当然,一方面垄断经营在一定程度上阻碍了网络的发展;另一方面,传输技术也是一个主要障碍。近年来,DWDM的发展解决了骨干网传输能力,多种宽带接入技术的采用,特别是局域网技术的应用解决了接入网的传输能力,可以说造成多媒体业务传输能力瓶颈的技术问题已经解决。在中国,信息产业部批准8家公司经营电信业务,目前这8家公司都在大力发展其骨干网的传输能力,骨干网传输能力的竞争局面已经展开。

  最近信息产业部又决定将放开接入网的经营,这项重大决策将导致接入网中的竞争局面,会极大地促进发展,传输能力作为多媒体业务发展的瓶颈现象将迅速被打破,多媒体业务应用系统的大发展时期即将到来。

  2 多媒体业务的定义

  在绝大多数人的心目中,多媒体业务就是能够提供图像、声音和文字的业务,有人甚至把仅具有静止图像显示能力的业务也称为多媒体业务,多媒体业务概念相当混乱。在这种情况下,业务定义是很重要的,业务定义不清,将会导致研究方向不明,ITU-T有一个研究组??SG1专门研究业务定义。ITU-T对于多媒体业务的定义是:具有集成性、交互性和同步性的业务称为多媒体业务。

  2.1 集成性

  集成性指的是能对内容数据(Content Data)信息、多媒体和超媒体信息、脚本(Script)信息和特定的应用信息进行存储、传输、处理、显现的能力。

  2.2 交互性

  交互性指的是在业务系统中人与业务系统之间的相互控制能力。很显然,交互性是多媒体业务系统必备的一个特性,但并非其独有的特性,目前许多业务系统也有着程度不等的交互性。如信息检索业务,它一般都提供菜单和征询单两种用户与业务系统的交互界面,用户可以通过点菜单或填写征询单,将用户的要求告诉系统,系统根据用户的要求,将满足条件的信息送给用户。用户与系统通过这一简单的交互过程完成通信过程。在多媒体业务系统中,交互过程将不再是这么简单,诚然,菜单和征询单这一类简单的交互过程在多媒体业务系统中仍将使用,以提供简洁而明了的交互操作,但是光有简单菜单和征询单的交互过程是不能满足多媒体业务系统的全部需要的,它将需要更为复杂的交互操作过程。

  2.3 同步性

  同步性指的是在多媒体业务终端上显现的图像、声音和文字是以同步方式工作的。例如:用户要检索一个重要的历史事件的片断,该事件的运动图像(或静止图像)存放在图像数据库中,其文字叙述和语言说明放在其它数据库中。多媒体业务终端通过不同传输途径将所需要的信息从不同的数据库中提取出来,并将这些声音、图像、文字同步起来,构成一个整体的信息呈现在用户面前,使声音、图像、文字实现同步,并将同步的信息送给用户。

  多媒体业务系统中的同步性是最主要的特征之一。信息的同步与否,决定了系统是多媒体业务系统还是多种媒体业务系统。此外,多媒体业务系统中的同步性也是最为困难的技术问题之一。一般来说,多媒体业务系统是一个资源受限的系统,所谓的资源受限指的是两种情况:通信速率受限和终端内存受限。如果这两个方面没有限制,同步本来不会有很大的技术难点,譬如说信道通信速率不受限,那么只要发端完全安排好信息媒体间的关系,在接收端就完全忠实地复现出来,信息同步将不成问题,当然在信道的通信速率受限的情况下,接收端的信息间同步就要困难得多。另外,如果接收端存储器的存储量是无限的,将所有信息全部接收下来,然后在终端内同步播出,这种场合下同步问题也好解决,但实际上这个条件经常是无法满足的,因而使同步问题就变得很困难了。

  从技术层面来讲,同步可以在3个层面上实现:链路层同步??帧结构同步;表示层级同步??句法级同步;应用层同步??脚本同步。

  3 多媒体业务系统中的编码

  编码是多媒体业务系统中的重要组成部分,没有编码技术的突破就不可能有多媒体业务系统的产生,对多媒体业务系统的编码而言,图像编码、语音编码和多媒体信息编码是最主要的3种编码。

  3.1 图像编码

  图像编码领域是非常活跃的,其中最为活跃的是低速运动图像编码,这当然是与通信网的现状,尤其是目前的接入网的现状是相关的。目前绝大部分国家与地区(包括美国),用户的主要接入手段仍是双绞线,尽管近几年来话带数据技术有了突破性进展,但也只有30~40kbit/s(双向)的数据传送能力,因而要开放多媒体业务首先要解决低速率运动图像的编码问题。

  近十年来,低速运动图像的编码的研究取得了巨大的进展,其中最有代表性的是H.263和MPEG4,H.263主要用于对话方式的多媒体业务中,而MPEG4主要用于存储回放式多媒体业务中。H.263是ITU-T提出的,MPEG4是ISO提出的,这两种算法的基础都是变换域编码中的离散余弦变换算法,两种算法在很多方面采用了十分类同的技术,它们两者是可以进行互通的,这两种算法的推出,对于低速多媒体业务系统是一个很大的促进。需要指出的是:近年来低速运动图像编码成就的取得很大程度得益于微电子技术的发展,由于DSP芯片能力越来越强,存储芯片的容量越来越大,使得原来无法实现的算法可以实现了,原来无法达到的处理能力现在能够达到了,从而产生高效优质的编码算法。但从算法的基础来说,近二十年来基本没变化,采用的仍是运动补偿加离散余弦变换算法。

  近年提出的其它算法,如:小波变换、分形交换和模型编码都没能达到大规模商用的程度,已经国际标准化的算法仍然还是基于离散余弦变换(DCT)算法的,因而近年来运动图像编码进展的取得主要是靠挖掘离散余弦变换加运动补偿算法的潜力取得的。在图像编码方面没有突破性的进展。

  在运动图像编码方面另一重要的进展是MPEG2编码的提出,MPEG2主要是用于存储回放型多媒体业务环境,它可以提供广播电视级图像质量乃至高清晰度电视的图像质量。MPEG2的提出使得目前人们最主要的消费娱乐方式??电视可以在数字网中传输,人们有可能通过网络来欣赏电视,多媒体业务将真正走进人们的生活。

  3.2 语音编码

  传统上,语音编码有两种方式:波形编码和模型编码。波形编码忠实于原始信号的波形,使用各种方式尽量逼近原始信号的波形,一般来说波形编码质量较好,但所需码率较高。与运动图像编码不同,语音编码很早就采用模型编码,它用激励源去激励模拟声道发音,一般来说模型编码的语音质量比较差,但编码码率很低。为了能获得高效优质的编码结果,近年来新的编码算法均采用两者结合的算法,即波形编码加模型编码的算法,速率为8kbit/s和4kbit/s语音编码的几乎所有候选方案都采用这种方法,从目前的情况来看4kbit/s语音编码已是这种方法的极限,很难再作进一步的压缩。要再提高语音编码效率必须要另想办法。

  语音编码目前有两个方向,一个方向是语音编码进一步低速率化,采用目前的等速率编码,已很难有更大作为,可以有突破的是变速率语音编码,这种变速率语音编码与分组网络是非常适配的,是一种很有前途的语音编码技术。另外一个方向是语音不压缩,这是因为目前传输带宽增长很快,传输成本大幅度下降,为语音编码付出的费用与所节省的传输费用相比变得不合算了,语音不压缩传输所需费用反而更低。但在分组网络环境下,特别是IP网络环境下,其丢包现象不可避免,语音必须作处理才能适应这种网络环境。语音编码的这两个方向都有很高的现实意义,是目前的研发热点。

  3.3 多媒体与超媒体信息的编码

  在多媒体业务系统中,信息不再是以简单的比特流的方式工作,而是以结构化信息元的形式存在。以结构化信息元的形态存在的原因是为了同步性、交互性。在多媒体业务系统中,结构化的信息元有两种,一种称为客体(Object),另一种为文件(File),这两种结构化信息元被广泛使用。在IP网中,文件这种结构化信息元使用得更广泛,在IP网中统一资源定位器(URL)实际上是带参数的文件名,Web服务器送回的是符合URL要求的文件,Web实际上就是在广域范围内文件的调用过程。

  结构化的信息元是由信息头和信息体构成,信息头指出结构化信息的全部结构,信息体则是一个容器,可以容纳各种图像、声音和文字的编码信息。针对两种不同的结构化信息,现已有两套国际标准:一套国际标准是针对文件(File)的,它是在SGML的基础上发展起来的,大家所十分熟悉的 HTML、XML和WML等是这类标准的一部分,Hytime大家不十分熟悉,它是更进一步的标准。

  另一套国际标准是针对客体(Object)的,它是以ASN.1为其句法的,标准称为MHEG,这也是一个很好的标准,由ISO与ITU-T共同开发,目前应用不十分广泛。尽管这两套国际标准在形式上有很大不同,但其基本概念则是完全一致的,它们都具有以下7个特点:

  (1)在表示客体(或文件)之间可以有不同的时间同步算法(绝对时间关系同步、相对时间关系同步、链接同步、循环同步和条件同步);
  (2)具有表示客体(或文件)间空间复合的能力和机制;
  (3)可以用超级链(Hyperlink)去引用外部的表示信息;
  (4)可以定义用户的不同输入请求;
  (5)定义客体(或文件)间的链接,例如:事件(Event)和反应(Action)的链接;
  (6)描述与客体相联系的项目(Project)信息,详细说明它是如何在用户面前显现的;
  (7)提供一种可引用内容或将这些内容包含在MH客体之中的机制。

  4 多媒体业务系统的现状

  多媒体业务系统的出现已有十余年历史了,十余年来多媒体业务系统有了一定程度的发展,但与预期的发展相比差距很大。

  多媒体业务系统需要两大支持:其一为数字信号处理技术,其次为通信网的传送能力。应该说近年来数字信号处理技术进展是很大的,它的进展可分为两个方面,即是编码算法和编码算法的实现。从编码算法来看,这10年来基本上是处于挖潜阶段,特别是运动图像编码,其基本原理为:运动补偿加DCT,十余年来这个基本原理一直没有发生变化,由于DSP能力的迅速提高以及固态存储技术的高速发展,使得算法的开发空间加大了,因而尽管运动图像编码是挖潜过程,10年来在编码的效率和编码的质量上还是取得了巨大的进展。在实现方面,微电子技术以每18个月能力翻番(摩尔定律)的速度前进,微电子芯片能力越来越大,体积越来越小,功耗越来越低,存储能力越来越大,价格越来越低,目前已经可以在芯片中以普通消费者可以接受的价格实现图像或语音编码算法。综合起来可以认为,数字信息处理技术10年来进展是巨大的,它完全适应多媒体业务系统发展的需要。

  多媒体业务系统发展所需要的第2个支持,情况就完全不同了。通信网的传送能力,特别用于传送多媒体业务的通信网传输能力发展得不理想。除了双绞线的话带数据能力上有了突飞猛进,Modem的传送能力已十分接近理论极限,传输速率已达40kbit/s(双向),它成为目前解决用户接入的主要手段,产生了一些以低速图像和语音编码为基础的多媒体业务。其余的进展就不理想了,ATM曾被认为是最理想的多媒体业务承载网,在ATM发展全盛时期也是多媒体业务发展的全盛时期。由于多媒体业务系统对网络承载能力的QOS要求很高,不能保证QOS的网络将无法向消费者提供令其满意的服务质量。ATM面向连接的工作方式和非常复杂的流程控制机制,保证了每一个连接服务质量。另外,ATM是基于分组交换的,与时分复用相比它的带宽分配十分灵活,它可以提供从窄带到宽带的承载业务的能力,这一些都是开展多媒体业务所必须要具有的特性。但是,ATM设计定位过高,信令过于复杂并迟迟不统一,其复杂的流控和信令使得设备非常复杂;另外,ATM的业务定位也过高,IBM曾把25Mbit/s作为基本业务所需要的速率,为此研发了质量很高的远程医疗等多媒体业务系统,这样的系统即使在美国要推广也非易事,没有业务很难使网络壮大,没有足够大的网络业务也很难高速发展,这使得多媒体业务和ATM网络都没能获得高速发展。

  IP技术虽然是70年代提出的技术,但真正崛起则是90年代的事,IP网的不面向连接和无复杂流控使得网络设备大大简化,在以非实时业务为主的数据通信环境下,它显示出极大的优越性。尽管到目前为止,在实时业务传输方面,ATM还存在着很大的优势,但由于目前网上实时业务不是太多,非实时业务仍占主导地位,使得IP网显现出的优越性仍远远大于ATM。于是IP网得到了高速的发展,IP网及其应用的迅速崛起,抑制了ATM 的发展。

  近几年来,在世界范围内IP 网得到了极为迅速的发展,特别是DWDM的出现和太比特路由器的问世,更起了推波助澜的作用。相比较起来,ATM网尽管也得到一定程度的发展,但主要用途是为提供综合业务的电信运营商作骨干传输用,基本上不发展基于ATM上的多媒体业务,原来在ATM网上标准化程度最高的VOD业务与会议电视业务基本停止发展,这些业务的标准化工作也停止了。另一方面,目前的IP网仍停止在计算机级的IP 网络技术上,业务的服务质量(QOS)尚未获得解决,还没有能力来开放多媒体业务。

  ATM上的多媒体业务发展被抑制,IP网还没有能力来开放多媒体业务,网络发展的这种局面,使得近年来多媒体业务的发展进展大大减慢,在某些方面还有所倒退。

  5 多媒体业务系统的发展趋势

  下一代的通信网络将是一个具有高交换速率,很大的传输带宽的IP网,关于这一点,已经是无人怀疑了。能做到这一点主要应该归功于IP网上应用的广泛和网络技术的快速发展,特别是密集波分复用技术实用化上的突破性进展及单波长传输速率的迅速提高。目前单波长SDH速率已达到10Gbit/s,32波的DWDM已经商用化,因而目前单对光纤的实际传输容量已达320Gbit/s ,实用的DWDM设备的传输容量可以超过1Tbit/s,实验室已完成了3.2Tbit/s(80×40Gbit/s)的试验。另外,路由器技术有了突破性进展,新一代的路由器已经出现,全新的路由器硬件体系结构,硬件化的路由表的查找和分组转发,使路由器的吞吐量提高了一至两个数量级,分组转发已下降至微秒量级,新一代的高性能、大容量40~160Gbit/s路由器已经商用化,太比特路由器的出现也是指日可待的事情,因而从技术上已经具备提供高速宽带网的条件。

  大量资源被制造出来是问题的一个方面,问题的另一个方面是这些资源能不能被消费掉,有没有这样的业务量需求,大量制造出来的资源会不会被闲置在那里。人类生存的历史已经表明,有生产就必然有消费,生产得越快,消费得也就越多,永远是一个动态平衡。IP网上资源的制造和消费也将是动态平衡的,在IP网上消费网络资源的大户是多媒体应用系统,目前由于网络资源不足,这些业务没有显露身手,一旦多媒体业务使用起来,资源的消费将会成百上千倍地增加。在90年代时,就有很多人预测21世纪将是多媒体时代,现在看来这个时间为期不远了。目前IP网的设备都是计算机级的,网络中使用的都是原来计算机网中的网络设备,因而虽然近年来网络的传输能力有了很大的提高,但是由于组成网络的设备只能提供尽力而为传输能力,这样的网络不可能用来提供令人满意的多媒体业务。

  IP网络技术正从计算机网走向电信网,为了适应电信网对服务质量的要求,IP网络中采用的技术将要作重大的变革,当然IP网不面向连接的技术和不作复杂的流量控制是必须保持的,它是保证网络设备简单和高性能的关键。但在其他方面,特别是动态路由技术方面必须作重大变革,主要是引入分类服务和电信级资源管理技术,在实现了变革后,IP网完全可以提供令人满意的服务质量。

  信息产业部决定在适当的时候开放接入网,在接入网方面引入竞争,可以肯定地说,制约多媒体业务发展的网络能力瓶颈很快就能得到彻底的解决。

  从数字信号处理及编码技术来看,图像编码技术和语音编码技术尽管从基本机理来说10年来没有根本性的突破,但10年来图像编码技术和语音编码技术的进展是巨大的,编码质量不断提高,编码码率不断下降,把它们用于开放多媒体业务已经够用。多媒体编码也在不断进步之中,Web中使用的HTML句法已经具有将多种媒体进行混合显示的能力,在非实时环境下让人们获得了声、文、图的享受,尽管这离真正意义的多媒体业务还有很大的差距,特别是不具有同步性,但能将声、文、图混合显示已具有很大的魅力。在HTML句法的基础上,为了提供更大的显示能力,人们引入Java和Plug-in技术,增添了帧级同步技术,人们通过Web可以获得唇音同步的影视图像。更进一步在Web系统中又引入Script技术,构造应用层级同步,从而在基于Web的系统中构建真正的多媒体业务。随着Web技术的不断扩展,基于Web的多媒体业务正在不断出现,基于Web的视频点播(VOD)、基于Web的会议系统等已经在局部范围内使用。在Web系统中目前还没有引入的是多媒体信息的同步技术,它是用于解决多媒体信息元(如File 或Object)复合结构之间的同步,这是表示层句法中的同步技术,从标准方面来说,无论是对于File的句法同步标准还是对于Object的句法同步标准都已存在,只是用得不多。这里有技术难度问题也有网络带宽问题,随着网络的发展和技术的进步,表示层句法中的同步技术必将会获得广泛使用。在IP领域,大家都熟悉HTML、WML、XML等,但很少有人了解Hytime,随着多媒体业务应用的不断扩展,表示层句法中的同步技术必将会获得广泛使用。

  多媒体技术的提出至今已有十余年的历史了,10年前在提出多媒体技术的同时,已经有了很多业务应用的设想,ITU-T 对多媒体业务进行了严格的定义和分类。10年来,各国专家们的任务是实现这些美妙的设想;10年过去了,在多媒体业务的应用方面,由于种种原因它未能取得预期的辉煌,大部分多媒体业务系统还处于实验室阶段或小范围运行阶段。未来10年,各国专家们的任务仍是实现这些美妙的设想,并努力克服阻碍多媒体业务应用发展的瓶颈,由于网络技术突飞猛进的发展,竞争机制的广泛引入,瓶颈将会被迅速打破,多媒体业务将会获得迅速发展,21世纪将是多媒体业务获得广泛应用的时代。

[摘要] 文章简要介绍了多媒体业务及其近十年来的发展,讨论了多媒体业务系统中的重要组成部分??编码技术,并就多媒体业务的现状对其未来发展作了预测。

[关键词] 多媒体 图像编码 语音编码 密集波分复用 太比特路由器

[Abstract] The paper briefly introduces the multimedia services and their developments in the past 10 years, discusses the key component of a multimedia system??the coding techniques, and prospects the development of multimedia services in the future based on present conditions.

[Keywords] Multimedia Image coding Voice coding DWDM Terabit router