基于意图的业务自动维持

发布时间:2021-03-26  作者:中兴通讯 吴正光  阅读量:

意图网络是实现网络自治的关键

 

伴随全球化、信息化的高速发展,以客户体验为中心的5G网络正在加速各行各业数字化转型。面向5G网络,结合SDN与AI的意图网络IBN(Intent-based Network)技术也成为各运营商与厂商研究的热点。

2017年,咨询机构Gartner提出了意图网络IBN理念,得到业界的普遍关注,3GPP和ETSI、CCSA也立项进行面向意图的网络技术研究。随着意图网络的引入,网络智能化的发展目标逐步清晰,就是逐步实现网络的自规划、自适应、自优化、自管理、资源按需调度,最终达成网随意动、无人自治。

基于对意图网络的深刻把握和深耕细作,中兴通讯推出了有线智能化Athena 2.0解决方案,其中包括基于IBN的全生命周期智能化产品ZENIC ONE,并与国内外运营商展开密切合作,进行意图创新功能的实践。基于意图的业务自动维持就是其中之一, 该功能作为ZENIC ONE的创新功能,实现了用户意图的持续保障,通过引入大数据及AI等技术提升业务级SLA,为客户带来更好的通信服务体验。

 

ZENIC ONE意图引擎架构

 

ZENIC ONE包括意图、自动化、感知三大引擎,其中意图引擎作为运维人员与ZENIC ONE人机交互的纽带与桥梁,是ZENIC ONE的核心。

意图引擎包括意图转译、意图感知、意图保障三大组件。意图引擎对外支持WEB界面和第三方北向接口,WEB界面中的意图管理(意图输入)组件负责用户意图的输入,意图管理(意图状态)组件负责意图生命周期内的状态呈现。意图转译组件负责与意图管理组件交互,当用户通过语音、文字等多种输入方式表达其意图后,意图转译组件与之交互确认,确保意图表达的完整性、去模糊性,构建起用户与机器之间的桥梁。意图转译组件还实现了一致的意图实现流程,即不管是用户输入的意图,还是网络内部的修正/优化意图,都会转化为统一的网络意图表达模型,并经历方案设计、网络编排和提前验证流程,然后生成配置信息下发给自动化引擎。意图感知组件将感知引擎上报过来的网络数据针对具体意图进行分析后,将意图分析结果同时发给意图管理(意图状态)组件和意图保障组件。意图保障组件根据该意图既定的保障策略进行对应的保障处理,比如带宽调整、路径调整、保护恢复等,确保用户意图的持久质量(见图1)。

        图1  ZENIC ONE三大引擎逻辑架构

 

业务自动维持的机制

 

业务自动维持能力能够持续保障用户意图,在系统出现问题时,通过AI等技术进行网络分析,反馈回控制器进行自决策来维持用户意图。ZENIC ONE基于意图的业务自动维持的架构参考了IETF提出的意图维持架构草案。方案中首先构造表示业务实例保障关系的有向图,我们称为Assurance graph。Assurance graph的节点表示业务或子业务实例,连线表示节点之间的依赖关系。每一个业务实例都有一个健康分数,表示业务的健康状态和症状,一般用0~100的整数表示,0代表彻底不能用,100代表状态完美。

比如,承载网络中一个5G基站接入L3VPN的意图,意图引擎会为这个L3VPN业务意图设置关联一系列的模板,这些模板描述了:

如何修改L3VPN业务,包括了新增、删除、修改站点信息;

如何维护L3VPN的健康,即assurance graph的蓝图。

具体的业务自动维持流程如图2所示。

L3VPN业务流的监测数据由Inband OAM(IOAM)机制收集:ZENIC ONE会利用Netflow自动探测网络中存在的流并自动给相应的流创建端到端的IOAM测量任务;

BIGDNA模块(感知引擎)会判断IOAM任务测量结果是否异常,通过IOAM逐条检测机制可以定位出现异常的流、节点以及链路并通知上报和存储到BIGDNA的数据库中;

意图引擎收到上报通知后,将对应的监测意图状态调为不健康,并判断是否有可进行调整的路由并进行路由调整;

倒换完成后新的IOAM任务创建,若测量结果正常,意图引擎根据BIGDNA上报结果,将监测意图状态调整为健康;

对于无法修复的故障,意图引擎会发出故障无法修复告警;意图管理界面会显示“自动修复失败”。

 

关键检测技术之Inband OAM

 

基于意图的业务自动维持实践依赖的底层核心技术是Inband OAM。IOAM随流检测技术通过在业务中加入Flow ID标签的方式,对业务流经过的网络节点进行逐条检测,可测量获得包数、时戳两个原始数据,经过控制器汇总计算,可获得如下性能指标:

-包数:每检测周期的收发包数,或一段时间若干周期的总收发包数;

-丢包率:每检测周期的丢包率,或一段时间若干周期的平均丢包率;

-单向/双向时延:每检测周期检测其中一个报文的时延;

-时延抖动:一段时间若干周期时延的时延抖动。

此外,利用Telemetry技术实现毫秒级节点丢包、时延信息逐节点上报,管控系统对流数据进行实时智能分析后即可精准定位故障发生位置。Telemetry是一项远程从物理设备或虚拟设备上高速采集数据的技术。设备通过推模式(Push Mode)周期性的主动向采集器上送设备的接口流量统计、CPU或内存数据等信息,相对传统拉模式(Pull Mode)的一问一答式交互,提供了更实时更高速的数据采集功能。

 

试点验证

 

相比传统的业务保障机制,基于意图的业务维持方案可以实现意图从规划到创建再到优化的全生命周期闭环维护。通过IOAM随流检测技术,可以实现毫秒级信息上报,秒级故障定界定位。再结合控制器的多重保护SLA机制,最终为客户带来故障发生零感知的用户体验。

2020年下半年始,中兴通讯与浙江移动一起就基于意图的业务自动维持功能进行了试点实践,在实践中验证和改良方案,推动意图网络的商用部署,促进网络运营向智能化迈进,加速5G承载网络的规模成熟商用。

分享到:

 选择国家/语言

Global - English China - 中文