SDH/ATM自愈网的层间升级机制

发布时间:2005-03-15 作者:金跃辉 Jin Yuehui 程时端Cheng Shiduan 阅读量:

随着人类社会信息化时代的到来,社会经济和政治的各个方面日益依赖于以宽带通信网络为基础的信息交换技术,业务所携带的信息价值也在迅速增大。同时,技术的进步和社会的需求使得各种通信网络的结构越来越复杂,传输线路的速率也越来越高。目前,最新的光波分复用技术已经在一根光纤上实现了400Gbit/s的传输。在中国,“九五”期间新建的干线光缆工程和扩容工程也都采用了2.5Gbit/s以上的SDH设备,此外还计划在全国主要传输节点引入SDH数字交叉连接设备。这意味着,电信业务一旦中断造成的经济损失和社会负面影响都将是非常巨大的。如何尽量减少由于传输线路中断或节点瘫痪而引起的业务中断,使网络在发生故障时尽快恢复,这是网络运营者和用户都极为关心的问题,也是网络生存性问题的研究内容。这一问题在组建宽带信息设施时显得尤为突出。国际上从80年代末开始研究网络生存性,美国、欧洲、日本等电信公司的研究机构(如Bellcore、Bell Lab、Alca-tel Bell、NTT Lab)均在致力于这方面的研究。

 

    网络生存性泛指网络经受各种故障,特别是灾难性大故障后仍能维持可接受的业务质量的能力。为了满足网络生存性的需求,自愈网的概念应运而生。所谓自愈网就是无需人为的干预,网络就能在极短的时间内从失效故障中自动恢复业务传输能力,而用户感觉不到网络已出现故障。自愈是网络生存性最突出的特点。自愈技术的性能指标主要包括恢复率、恢复时间和冗余度。恢复率是指已恢复的失效容量与失效的总容量之比。冗余度通常是指备用空闲容量与总容量之比。一般情况下,冗余度越大,恢复时间越短,恢复率越高;允许的恢复时间越长,恢复率也就越高。为了提高网络生存性能力,通常可以通过以下一些途径:降低网元的脆弱性、提高网络拓扑结构的可靠性及通过网络自愈技术来实现网络的生存性。基于光SDH传输网络和ATM交换网络是构建未来宽带通信网络的最重要的途径之一。因此,生存性问题在SDH和ATM网络中变得越来越重要和突出。

 

 

1 SDH网络的自愈技术

 

1.1 自动保护切换(APS)

    自动保护切换方法为每一个网络单元设置一个专用的备用单元,一旦检测到失效,立即将该网络单元上的业务切换到备用单元,然后对失效的单元进行修复。在SDH/SONET光缆保护中,备用光缆的路径往往与主用光缆的地理位置不相交,使得工作光缆被切断时能保护其上的业务。由于采用物理设备切换,APS方式的反应速度非常快,然而物理资源没有被充分利用,因此造价较高。

 

1.2 自愈环(SHR)

    自愈环结构是由SDH/SONET的分插复用器(ADM)构成的环型拓扑结构。它利用了ADM的分插能力和智能性,通过ADM节点把两根或4根传输方向相反的光纤串接在一起,能够改善网络的生存性,减少远距离传输所需的再生器,降低网络成本。对于一个方向上的业务流量,经常在相反方向上保留相同的空闲容量,以达到任意两节点间的业务保护。这种方法可以保护两相邻节点的链路失效或者一个节点的失效。SHR定义了工作通道和保护通道,当发生失效后,业务便从工作通道上切换到保护通道。SHR上的节点数一般不超过14个。

 

1.3 泛洪式恢复算法(Flooding)

    泛洪式恢复算法是一种分布式控制算法,主要用于连接度高、业务量集中的网状网中,尤其是长途网中,网上的每个节点对网络拓扑只有有限的了解。当一条链路失效时,连接该链路的两个节点检测到失效,就试图去恢复该通道。其中一个节点成为发送者,另一个成为选择者,发送者向与其相连接的所有有足够空闲容量的链路广播恢复消息。每个中间节点(除了发送者和选择者)都重发恢复消息。当恢复消息到达选择者,它就发回一个连接消息给发送者,这样就找到了一条变更路由。

 

 

2 ATM网络的自愈技术

 

2.1 ATM网络自愈的特点

    与SDH自愈技术相比,基于虚通道(VP)的ATM自愈技术具有以下特征:(1)非分级的通道结构;(2)独立的通道路由建立和容量分配;(3)丰富、灵活、快速的操作、管理、维护(OAM)信元。VP路由和容量管理的独立性以及非分级的通道复用导致了ATM网络的两个重要特征:动态容量分配和适应性网络重构,两者均可以应用在自愈技术中,加上OAM信元的应用,使得ATM网络的自愈技术比SDH网络中的自愈技术更有效,恢复速度更快。并且,ATM层能有效、快速地检测软故障,如比特差错率为10-4

~10-5时,ATM检测只需要1ms,而SDH需2s,可见ATM技术大大提高了网络的生存性能力。ATM VP子层的APS、SHR、自愈网(SHN)技术以及虚信道(VC)子层的重定路由技术也正处于研究、发展中。

 

2.2 备用VP恢复算法(Backup VP)

    备用VP恢复算法是利用ATM中VP可以分配零值带宽的优越性。在失效发生前,为每一条工作VP都预分配备用VP,备用VP的有效带宽为零,且备用VP与工作VP除源、宿节点外不存在公用的中间节点。一旦失效发生,可以立即切换到备用VP,速度很快。这样,在恢复过程中,不需要捕获容量,直接传送恢复消息进行切换,恢复速度更快,处理更简单,可靠性高,但资源利用率大大降低了。该机制只适用于较高生存性要求的虚通道电路(VPC)。

 

2.3 泛洪式恢复算法

    泛洪式恢复算法从SDH的泛洪式恢复算法发展而来,是一种基于ATM的分布式控制算法,每个节点对网络拓扑只有有限的了解。当一条链路或节点失效时,失效链路的两个端点或受影响的VP的源、宿节点检测到失效,就企图去恢复该通道。两节点向与其相邻的所有有足够空闲容量的链路发送恢复消息。每个中间节点都继续向其邻接节点广播恢复消息。当源和宿节点发出的恢复消息在某个中间节点相遇时,就找到了一条变更通道。这个中间节点就发回一个响应消息给源、宿节点,实现恢复切换。该算法具有资源利用率高的优越性,但恢复速度相对慢一些。

 

2.4 混合式自愈算法(HRA)

    混合式自愈算法是在ATM层将备用VP算法和分布式泛洪恢复算法结合起来。若失效发生,当存在相应的备用VP时,备用VP首先作出反应;当不存在备用VP或备用VP在某一时限内不能完全恢复所有失效VP时,泛洪式算法将作出反应。若两种方法在某一时限内还不能完全恢复失效VP时,则作集中式恢复处理。在完成恢复后,要进行自重构操作。混合式自愈算法能充分利用以上两种算法的优点,实现多层次恢复性能,满足不同用户的要求,从而以较低的成本实现网络的生存性。

 

 

3 SDH/ATM自愈网络的层间升级机制

 

3.1 升级机制的重要性

    在一个分层和分割的网络中实现生存性能力是复杂的,因为恢复系统可以在不同层、不同子网实现。宽带网络需要一个全局的控制策略,结合多种恢复技术在不同层(ATM、SDH层)以及不同子网(本地环、接入网、骨干网)获得端到端的生存性,以实现网络在故障情况下的业务恢复。当一个层或一个子网发生失效,由于缺乏足够的空闲资源,其本身的恢复系统不可能完全恢复业务,就出现了升级问题。更精确地说,不同层或不同子网间的升级就是不同层间或子网间恢复系统的合作协调,以有效地利用网络资源、防止冲突、提高生存性能力。若没有升级机制,不同的恢复系统就有可能相互制约而不能有效地恢复,甚至可能将网络锁定到一个未知的状态。

 

3.2 分层网络中的生存性选择

    宽带网络由多个网络子层构成。将网络分层的概念源于一层为另一层的服务层,另一层为一层用户层的思想。一个分层的网络为设计者提供了很大范围的生存性策略选择。在高层还是在低层,或在几个层都提供恢复机制是一个策略性的决定。没有一个简单的设计算法能解决这个问题,一个关键原因是:较低的网络层不能完全保护高层。例如:通过增强低层SDH的恢复能力,ATM层业务的恢复可以得到提高。但是,SDH不能保护ATM层发生的失效。因此,任何一个直接提供业务给用户的网络层,如果它想提供高可用度的业务,其自身就需要有一些保护机制;反之,任何不直接提供业务给用户的网络层就不一定需要有恢复机制,因为高层能为之提供恢复能力。实际上,网络支持多种业务,它们可分在几个不同的网络层被保护。因此,在一个层内的有些链路需要保护,而其它的则不需要。如一些给用户提供直接连接的SDH链路需要保护,而其它支持ATM层业务的SDH链路则可能不需要。

    此外,如果一种恢复机制被认为在某一层是最好的,这并不意味着它应该运用在每一层。因此,如果每层用的恢复机制都相同,就没有什么收效。例如,如果每层都采用事先预备恢复路由的方案,那么没有哪一层能处理未知失效事件的发生。同样,如果每层都用实时搜索迂回路由的方案,那么恢复的结果将难以预料。因此,在不同的网络层提供不同的恢复机制能最大限度地发挥各自的优点,会更有效。一个比较合理而可取的方案是:首先采用事先预备恢复路由的方案,然后用灵活的实时恢复方案去处理前者不能解决的问题,这类似于前述的混合自愈算法思想。

    目前,没有一个简单的方法能建立一个多层次恢复策略,因为必须考虑每种方案的经济性。决策应随不同的业务及不同的恢复要求而变化,还要考虑这些机制之间如何相互影响,以及它们是否需要协调。目前,总体上有3种类型的升级策略可供参考。

 

3.3 依次启动的升级机制

    该机制是每层依次作出响应,从最低层开始,逐渐向上层延伸。这个升级处理能由一层用明确的消息告诉另一层接管,或者通过触发不同层恢复动作的起始时间进行。

 

3.3.1 基于消息控制的串行升级策略

    当物理层发生失效,SDH层的一些VC-4会受到影响。SDH层的恢复策略会以STM-1为单位进行恢复。当SDH层恢复结束或达到预定的恢复率(不一定100%)后,SDH层的管理系统根据客户机/服务器的关系告诉ATM层发生失效了,ATM层的管理系统才能确认哪些VP受到影响,哪些VP已被恢复,并激活相应的恢复算法。

 

3.3.2 基于时间控制的串行升级策略

    在SDH层只要失效被检测到,上游的节点成为选择节点,而下游的节点成为发送节点。发送节点设置一个固定的时间,时间的长度必需根据实际情况而定,但是,从大多数结果来看,取200~300ms比较理想。时间的长度要随着网络拓扑结构、传输和处理时延的变化而变化,它可由TMN单独计算出。

如果在预定的时间内,SDH层找到的可用带宽足以全部恢复时,不必要升级;否则,控制交到VP层。在VP层的恢复也是基于发送-接受的关系。恢复过程完全类似前述的几种恢复过程。

 

    总之,串行升级策略的优点是控制简单、易于实施;缺点是恢复速度慢。

 

3.4 同时并发的升级机制

    并行启动机制具有恢复快(特别是高优先级业务)、简单(不需要各恢复机制的相互配合)的特点,但极可能造成恢复时的冲突和恢复后的资源浪费。因为各层独立且并行地恢复各层各自的连接,高层的连接极可能被多次重定路由。例如,若ATM层和SDH层并行启动各自的恢复机制(假定都是基于链路级恢复),仅在ATM层的VP失效而SDH层中数字通道正常时,恢复没有问题。若SDH层中数字通道(如VC-4)失效,ATM层中受影响的同一VP有可能被恢复两次,如图3所示。若SDH层通道d失效,同时引起ATM层VP a失效。并行启动各自恢复机制,ATM层恢复VP a到b。而SDH层恢复通道d到通道e-f。尽管在ATM层中VP a连接没变,但事实上造成a又被恢复一次。只给出了一个VP的例子,实际上通道d可能承载许多VP,并且一条物理链路上可以承载许多SDH通道,一旦物理链路失效,将引起许多通道失效,这样问题更为严重。因此,若采用并行启动策略,需TMN介入作一些消除操作,以避免造成有限资源的冲突和浪费,从而达到有效的恢复。

 

3.5 集中管理方式下的升级机制

    这种策略的诊断处理和升级的协调都在集中管理方式下进行,即TMN积极地参与恢复处理,但仅仅是启动和终止每个层的恢复机制。在每一层被触发的恢复机制按分布式方式进行。这种策略需要不同恢复机制之间更多的合作,但是它能减少恢复时间。尤其是当一种恢复机制在预定时间(Time-out)之前就已经无能为力并放弃恢复时,基于诊断的升级模式能检测到在哪里一个机制已经失败了或者推断某个机制不可能成功,于是把恢复控制交给下一层的恢复机制。

 

 

4 结束语

    通过层间升级机制来管理和协调SDH/ATM自愈网络的恢复,可以有效地提高网络资源的利用率,避免冲突或死锁,大大提高网络的生存能力。研究完善、合理的层间升级机制对保证宽带网络的安全性具有重要的意义。

[摘要] 在一个分层网络中,单一的恢复机制不可能满足宽带网络生存性的需要,如何协调配合SDH层和ATM层之间的恢复策略是一个亟待解决的问题。文章首先介绍了SDH和ATM网络的自愈技术,然后对SDH/ATM自愈网络的层间升级机制进行了讨论。

[关键词] 网络生存性 同步数字序列 异步转移模式 自愈 层间升级

[Abstract] In a network with multiple lay-ers,a single recovery mechanism is unable to satisfy the requirements of broadband network survivability.It is urgent to optimize the coordina-tion of recovery mechanisms be-tween SDH and ATM.This paper first introduces the self-healing technologies of SDH and ATM re-spectively,and then discusses the escalation strategies of survivable SDH/ATM networks.

[Keywords] Network survivability SDH ATM Self-healing Escalation