多媒体通信技术的新进展

发布时间:2005-03-16 作者:蒋林涛(电信传输研究所) 阅读量:

▲ 1999年ITU-T SG16会议的研究重点为基于IP网的多媒体通信系统

▲ 本次会议提出了一个十分重要的提案 H.GCP

▲ 本次会议开始了对电子商务的研究

 

      ITU-T SG16是专门研究多媒体通信技术的国际标准化组织,它引导着国际多媒体通信研究的潮流,它在多媒体通信标准化方面所取得的进展,应引起各方面的高度重视和关注。

 

1 IP网的多媒体通信系统

 

    IP网的多媒体通信系统是此次会议最重要的热门话题。由于IP应用取得了巨大成功,ITU-T所有研究组都将IP的研究列入重点。本次会议在这个方面重点研究了如下一些问题,这些内容对国内电信业务的开发、运行和研究有着重要的意义。

(1)网关控制协议(H.GCP)

    本次会议提出了一个十分重要的提案——H.GCP。由于它对当前IP网中多媒体会议系统,特别是当前热门话题IP电话有很大意义,因此在本次会议中研究进展很快。经近两周的研究,本次会议已决定把H.GCP确定下来。H.GCP是根据朗讯(Lucent)提出的MGCP(IETF草案)来的,其基本思路与MGCP一致。从目前来看,它的首要应用是IP电话。H.GCP从本质来说是把应该原本在网关(GW)中实现的内部协议转换为外部开放协议。考虑到网关(从目前来说是话音网关)的功能过于集中,导致网关设备过于复杂,由于当前IP网中的实时应用都处于初级阶段(特别是语音正处于发展的阶段),功能(特别是控制功能)尚未确定,因而将网关拆开,分为媒体网关(MG)和媒体网关控制器(MGC)是一个很好的主意,这样做同时也便于和现有的网络和信令系统互通。分开后的媒体网关功能很单一,它只负责媒体流的通信、采集有关信息及播放提示音,其他功能都将在媒体网关控制器中实现。从H.GCP本身协议而言,目前这只是相当初步的,特别是它如何对多媒体流的控制问题还没有解决。尽管当前H.GCP还比较简单和初步,但它代表一种方向,它有可能会改变当前某些业务网的体系结构,因而要特别引起研究开发部门、业务运行部门和标准化部门的高度重视。当然,H.GCP还有很多方面值得研究,特别是网关拆成MG和MGC后,业务网的体系结构、原有体系中设备的功能将重新分配。这些问题都是必须加以深刻研究的。

(2)H.225 Annex G

     H.225 Annex G是上次(1998年9月)会议中提出的,原先H.225 Annex G提出是为了解决网闸(GK)间的通信。在IP会议进程中,终端与GK间通信是使用RAS协议的,作为IP会议系统的一种简化形式的IP电话,其网关与GK之间也是用注册、准入和验证(RAS)协议,但这有很大局限性。它只适用于小网,而不适应作大型网络。为满足大网的需要,就必须解决GK间的通信。上次会议中曾讨论过两个提案(AT&T和Lucent各一个),会议最终确定了Lucent的方案——H.225 Annex G。本次会议H.225 Annex G以正式文件形式提出,但Annex G中涉及的协议则是边缘设备(ED)之间的通信协议,非GK间的通信协议。H.225 Annex G首先讨论了管理域的体系结构,提出了4种可能,分别为:树形结构管理域体系结构、平面全连通结构管理域体系结构、清算中心结构管理域体系结构、汇接点结构管理域体系结构;其次提出地址的描述结构,提出了两层形式的地址描述结构、模板和描述项。模板是地址的一个记录,描述项则是这些记录的集合;第三,提出了用于模板数据和描述项数据交换的通信协议,通信协议内容有:服务记录确认和释放,描述项记录确认,接入记录确认和释放。从协议来看,Annex G只是解决了地址数据的交换。在Annex G的最后,给出了一个通信流程,该通信流程中GK与GK不通信,而只与ED通信。GK与ED间的通信用RAS协议。从研究分析来看,这样做是可行的但不一定是一种好的方法。特别是H.GCP提出后,可能会有另外的方案提出,尤其是针对IP电话的体系结构。

(3)H.323及相关附件

     本次会议通过了两个H.323的附件:Annex E(复合呼叫信令传送的框架和规程)和Annex F(简单终端类型)。

     Annex E描述了如何在GK路由模型中通过UDP或TCP快速传送复合呼叫信令的消息分组格式和过程。Annex E和H.323 v2中引入的“快速连接”方法相结合,可实现H.225.0呼叫的快速建立,这对压缩IP电话/H.323多媒体通信终端的呼叫建立时间有着重要作用。从安全和流量考虑,Annex E不应在公共因特网上使用,而是用于“可管理网络”,并使用H.235(IP-SEC)安全服务确保传送复合呼叫消息的安全,在公共因特网上仍建议使用H.323 TCP信令传送方式。

     Annex F规定了符合H.323 v2必要功能子集的简单终端(SET)的分类和通信过程及规程消息等。该附件针对IP电话应用规定了简单音频终端类型。它利用H.323规程中必要子集来操作,保持了与完整H.323 v2设备的互通,减少了系统实现的复杂性。在该附件中规定了SET的RAS信令(H.225.0 RAS)、呼叫信令(H.225.0呼叫控制)、多媒体系统控制信令(H.245)、媒体分组和传送(H.225.0 RTP)、补充业务(H.450)、多点会议操作、松散会议(H.332)、管理信息库等内容。

(4)会议厅管理协议

    会议厅管理协议(T.MRM)是本次会议提出来的。它的基础是会议管理协议(T.124 GCC),在GCC的基础上进行扩展已适应于会议厅中的会议管理。它增加的服务有:虚拟会议室以及创建、加入、离开和撤消会议。它提出组成会议应有:召集人、主席、秘书和普通与会者。

    T.MRM提出了完整的管理体系,特别是增加会议服务器来负责与会者的接入。目前会议管理是会议系统的一个难题。绝大多数会议系统都没有实现会议管理,因而也应引起重视。

 

2 电子商务

 

     上次会议将电子商务列为SG16小组一种新的研究课题。从本次会议开始,SG16开始研究电子商务。由于目前电子商务只有一个由企业提出的标准——SET标准(它只适于信用卡的标准),ITU-T、ISO还没有对电子商务进行过全面的研究,而电子商务有着巨大的应用潜力,因此对其进行全面的标准化是非常必要的。本次会议主要研究了电子商务的定义和功能范围。

     ITU-T对电子商务的定义为:电子商务是所有通过电信网络交换商业事物数据的业务。它定义了5种电子商务行为:

①广告;

②用于销售的物品浏览;

③分类项目的检索,建立购买合同,确认;

④交换商业文件;

⑤付款和金融事物。

      目前,ITU-T在电子商务方面刚起步,但我们认为它定义的是真正的商业行为,而不是“广义”电子商务。我们比较认同这种方向明确的定义,只有这样才能进行真正的标准化。这个课题国内有一定的基础,国内的电子商务不能全盘采用SET标准,这一点已经得到证实。国内电子商务的标准化已是当务之急,因而这也是非常值得研究的课题。

 

3 话带信道编码和MODEM管理

 

(1)V.91

     上次会议已经通过了V.90建议,它是PCM MODEM的一个重要建议,属于Q23课题。它实现了ISP到用户的最高信息下载速率达56kbit/s。V.90建议是WP1主研究期的一个公认的重要贡献,现在V.90建议的MODEM产品已大量推向市场。

    对V.90建议,ISP端为数字MODEM,而用户端仍为模拟MO-DEM,上行速率仍限于33.6kbit/s以下。本次会议通过了V.91建议。对V.91而言,双方MODEM均直接以数字形式与四线数字交换网连接,主要适用于ISP和ISP通过交换网的通信或ISDN终端与PCM MODEM之间的通信等。V.91的应用场合当然比V.90要窄得多,但它也是继V.90之后的一个重要建议。

     V.91建议与V.90建议编码器结构基本相同,它与V.90的主要区别是:V.90 MODEM到用户是二线模拟用户环路,要通过二、四线转换器,为避免非线性失真,采用卷积频谱成形技术以抑制下行信号频率中直流分量。V.91应用场合是四线数字连接,V.91就不必采用卷积频谱成形技术,原来V.90中频谱成形器对V.91仅是一个差分编码器,对V.91冗余比特数Sr=0。V.91模编码器输入比特数最高可达到42(V.90为39),用户数据所用特性比特数S=6(V.90为3~6),此时最高速率可达到64kbit/s。V.91与V.90步进速率同样是1.33kbit/s。

(2)V.MMO

     本次会议中讨论了Q4课题提出的V.MMO。V.MMO可以用于检索、诊断话带MODEM许多不同特征的运行信息,这些信息将写成人机均可读格式。其中主要检索项目有发送和接收信息速率、MODEM种类(V.90或V.34)与各种诊断信息。而对V.90而言,这些诊断信息应包含INFO、INFO1、MP、CP、功率电平、符号速率、载波频率、往返时延、DIL Descriptor等。

 

4 图像编码和语音编码

 

4.1 图像编码

       H.263 v2在上次会议上已通过,H.263 v2也就是H.263+。H.263 v2与H.263相比,又可以平均提高近25%的压缩比。本次会议将H.263 v2用于H.320的文稿已通过。

      MPEG-4已进入最后编辑阶段。它使用ISO的文件,包括视频与音频。本次会议上讨论MPEG-4用于H.324文稿,并提出在H.245增加新的数据能力与模式。

    目前,图像编码的两个研究热门是H.263++和H.26L。H.263++是一种低码速图像编码的近期标准,主要是对H.263进行改进和增强,以针对实时通信和相关的非对话服务。其改进和增强包括以下内容:增强和修改图像选择(用大存储)、仿射活动补偿、减少IDCT失配、去方块滤波、自适应差比、具有错误还原的数据分配与错误掩盖机制等。H.26L则是一个全新的图像编码技术,它不只是在H.263基础上改进,而且也面向将来的应用,其性能与H.263相比优越得多,是一项较长期的目标。本次会议对H.26L提出明确的目标:在达到同样图像质量的前提下,比特率减少一半,要考虑误码环境,但对H.26L不限制计算能力,同时也不需要与H.263兼容。以上目标将为许多机构和学者提供施展才华的机会,创造广阔的研究空间。这两种视像编码的研究期限分别为2000年底和2002年中期。目前正在对一系列关键技术进行研究。

    本次会议上,Siemens公司有一个迟到文稿提出了一种“基于内容的系数映射”方法,通过强化前景图像、弱化背景图像的方法,以较小的复杂性换取压缩率的增加,并有可能实现速率控制,这种方法尤其适用于移动通信。该算法还有待进一步研究。

 

4.2 语音编码

     语音编码方面的研究内容主要有以下几个方面。

(1)可变速率话音编码问题

     目前,无线通信系统和IP技术正在迅猛发展,即将在全球通信系统中占据越来越重要的地位。传统的话音编码技术是基于电路交换网(CSTN)的固定速率编码方式,难以适应无线/IP网的需要。因此,如何设计一种新的编码技术,以适应无线/IP网并有效利用带宽便成为一个重要课题。

     可变速率(VBR)编码技术是近年来发展起来的,其核心思想是对话音的瞬变、平稳、无声阶段采用不同的速率进行编码。瞬变阶段信息量丰富,应采用较高的速率;平稳阶段采用中等速率;无声阶段则采用较低速率。由于话音瞬变较少,正常话音大量是平稳(周期性)的,无声段则大约占60%。因此,平均速率将比同等话音质量的固定速率(FBR)编码低,研究表明,常常可低到50%以上。目前,有些话音编码算法(如G.728 Annex H)中采用了VBR技术,但真正能更好地发挥VBR技术优势的应用领域是对话音编码速率无严格速率限制、而又要求有速率“弹性”的场合,如CDMA、VoIP、ATM、CME等。

(2)4kbit/s左右速率的话音编码

    该问题是最近的研究热点,主要用于极低速PSTN可视电话、个人通信、话数同传系统和移动电话卫星系统,还可用于数字电路倍增设备(DCME)、分组电路倍增设备(PCME)、低速移动可视电话、信息查询系统和专用网络。

1998年9月第3次SG16会议上曾有8种候选算法参加了评测,但没有一种算法能满足参考条款(ToR)要求,因此,我们对本次会议上能否有所进展很关注。本次会议上没有收到具体技术文稿,但有15家公司表示要提交16种候选方案参加评测,本次会议主要评论评测协调方法和程序,评测结果在1999年9月提交给本课题报告人会议上讨论。现在还无法预测届时是否有满足要求的候选算法出现。

(3)7kHz宽带音频的编码

    由于技术实现上困难,上次会议将该问题分为以下两个课题:

   ①24、32kbit/s编码速率的7kHz宽带编码(G.WSC1)

    该编码的主要应用方面为:

    .ISDN BRA中的视频电话;

    .ISDN BRA中的视频会议;

    .ISDN宽带电话;

    .Internet上的宽带传输。

    本次会议对两种候选算法进行了评测,虽然在3%随机丢帧情况下,两种算法均不能满足要求,但考虑到尽快应用,会议决定采用一种算法作为低丢帧系统下的宽带音频编码标准,提高丢帧条件下算法稳健性的问题留待下一步研究,并在今后作为Annex标准制定。

     ②16kbit/s左右编码速率的7kHz宽带编码(G.WSC2)

      本次会议主要研究讨论了该编码的ToR,与以前相比,增加了编码速率在12、16、24kbit/s之间可变的要求,以提高该标准的灵活性和适用范围。该编码的主要应用为:

      .VoIP和Internet应用:Internet上宽带传输和IP视频会议中的高质量话音;

      .PSTN应用:高质量音频会议和商务应用(点对点/多点);

      .移动通信:高质量话音和第3代移动通信服务;

      .ISDN宽带电话:多信道应用中的高质量音频会议;

      .ISDN可视电话的视频会议:在单ISDN信道上提供高质量话音或在多ISDN信道上改善视频质量。

(4)现有标准的扩展

     这方面的研究主要是对现有标准进行扩展,以满足各种实际需求。本次会议对G.723.1 Annex A和B、G.721 Annex E、G.728 Annex H中的错误进行修改。G.728 Annex I是针对有帧丢失的环境(如移动通信)而对G.728进行的扩展,主要针对40kbit/s的DCME应用,已在上次会议中确定,这次会议上对其修订后表决通过。

        G.728 Annex J是针对DCME应用的G.728话带数据(VBD)扩展,是一个较重要的标准扩展。以色列MOC提出了一种候选算法,会议对其测试结果进行了审阅,并要求增加DTMF性能测试结果以及考虑算法的改进。

      本次会议上,AT&T提交了一个迟到文稿,提出G.711丢帧掩盖(FEC)算法。其测试结果优于其他基于码激励线性预测(CELP)的FEC算法(如CELP的FEC可允许的误帧率——FER最大为5%,而G.711的FEC算法可允许20%的FER)。因此,该算法对于G.711在分组网上的应用具有重要意义。

 

 

(收稿日期:1999-09-09)