4G/5G无线网络融合管理自动化

发布时间:2019-11-15  作者:乐树彬 杨威 王秀亭 中兴通讯  阅读量:

随着5G第一个标准规范R15的正式发布和5G试商用网络的大规模建设,业界对4G/5G网络共建共享、融合管理赋予了新的使命。由于5G网络引入了新的核心技术,如子网切片、网络功能虚拟化、边缘计算等,4G/5G网络管理运维的自动化、极简运维概念也开始备受推崇。

为满足未来网络技术演进和管理运维的新需求,中兴通讯推出新的网管软件架构。新的软件架构基于PaaS平台,提供灵活的微服务和容器化开发、能力开放等能力。新的架构寓意为开放使能系统(Openness Enable System),简称为OES架构。基于OES架构和4G/5G融合管理需求,我们重新设计了新一代无线网管UME(Unified Management Expert,UME)系统。

新系统(以下简称为UME网管)提供统一的WebUI入口,开放API,提供统一的集中管理能力,支持2G/3G/4G/5G网络融合管理,集成VNFM和NSSMF管理能力,具备对VNF生命周期管理和5G网络子切片管理能力,提供网络智动运维应用,实现运维自动化。

4G/5G网络融合管理核心能力

UME网管为解决历史网络管理问题和老网管的能力缺陷,引入了四大核心管理能力。UME网管的设备管理能力更强大,同时具备网络智能运维和敏捷交付能力。

统一接入管理,开放的南向架构                                   

UME的南向网元管理应用设计了南向架构(见图1)。南向接入层分为南向接入框架和协议适配器;

南向访问服务则提供统一的API接口服务能力,屏蔽多种网元的差异。因此,南向架构具备开放的网元设备接入管理能力:

-基于插件和微服务架构,通过开发多种适配器,能够灵活接入不同类型网元;

-向应用层屏蔽通信协议差异,在南向访问服务提供统一的访问原语;

-通过适配器管理组件进行协调,使得不同类型网络的接入互不影响,支持水平扩展。

数据采集管理:数据同源、开放

网络管理,数据是一切运维和优化的基石。4G/5G融合网络,各种新业务层出不穷,对系统和业务运行状态数据的采集需求更高,数据采集的一致性、准确性、实时性,都是必要条件。同时还要求数据采集的接口统一和简化,支持不同类型、不同版本网元的数据采集。

-数据同源
数据源根据自身的业务特性上报一份数据,后续的数据采集服务,根据数据需求加工成不同粒度不同业务视角的输出,输出的不同数据类型保证一致性、准确性。同时根据数据输出形式不同,分别提供不同的上报通道,保证数据实时性。按照上报的数据量、实时性要求,对不同通道提供不同数据上报保障能力。

-基于模型驱动的统一采集
基于数据同源,采用模型驱动方式来提供统一的数据采集管理服务。
基于统一的数据采集模型,数据采集服务向数据使用者提供统一的数据订阅接口。根据数据采集模型定义不同的接入网元类型,将网元采集能力实例化。
数据采集管理通过加载采集模型,一方面根据模型定义采集处理过程;另一方面向数据订阅者提供准确的数据能力描述。对于差异化网元,通过模型描述的采集适配服务,保证对外呈现统一的数据订阅接口。

-数据处理的能力扩展
基于统一的数据订阅接口,即可实现数据采集、数据描述、数据解析的统一。数据使用者则专注自身业务逻辑,按需订阅数据,实现自动化采集,从而在系统内催生出数据分析处理服务和应用。

全领域建模,模型驱动,敏捷交付

为了实现新4G/5G网元自管理,简化和标准化网管网元接口能力,我们推动了网元全领域建模研发实践,以及前后台解耦、网元模型DevOps的深入发展。

模型是对网元设备开放能力和功能特性的抽象定义,是管理核心,通过全领域建模来驱动前后台架构和方案设计,简化接口管理流程,便于快速敏捷交付和标准化管理。

网管和网元基于模型来驱动管理能力,这就是模型驱动。模型驱动可以进一步推动前后台业务解耦,如基于模型自动生成用户可操作的命令行。图2简要描述了前后台解耦在变更不同阶段的研发收益。

模型DevOps,保证模型开发质量,提高模型开发效率。通过领域特定语言,对模型以代码可读的方式进行描述,像管理代码一样管理模型。模型DevOps贯穿模型开发整个过程。基于模型DevOps,有效提升网元模型质量、模型文档自动化生成和模型一致性。

统一智能中台,智能应用遍地开花

UME网管引入了无线智能中台。智能中台的共享服务对4G/5G网络中的数据(告警、性能计数器、信令等)进行模型建模和数据治理后,通过模型训练生成可推理的算法模型,基于算法模型在现场进行推理验证,驱动模型训练算法闭环。

图3描述了UME网管的智能中台架构。其中,前台应用包括两类应用,一类应用是直接给客户带来运营价值的应用;一类应用是探索类的,侧重于AI探索和功能开放。


智能中台主要包括三类服务:从上而下看,上层是面向前台应用的智能运营服务,下层是面向4G/5G网络数据的数据治理服务和训练推理计算服务,这三类服务引入大数据、人工智能和机器学习的计算能力和AI算法。

基于智能中台的前台应用有告警自动化专家、AI探索、网络质量洞察等。这些前台应用的上线,将网络管理和运维从人力密集型向专家级/智能化发展,进而实现自动化目标。

4G/5G网络融合运维自动化

无线接入网络的融合管理和运维是当前业界的一大核心诉求。基于我们对通信行业的理解、与客户的深入交流和课题合作,我们在新一代无线网管UME系统中进行了大量富有成效的管理运维的提效实践。

灵活制定策略规则,流程自动化

基于ECA(Events-Conditions-Actions)模型,策略框架提供自动化处理流程:当网络事件(Events)满足设置条件(Conditions)时,会触发一个或多个操作(Actions)。

用户可以根据特定的业务场景(想法),使用网管提供的API接口,灵活制定出符合业务的策略规则。当策略框架加载这些规则后,业务能力将变得自动化,这个过程为客户带来如下价值:

-以事件驱动的手工运维都可以转换成基于策略的自动化运维,降成本,运维提效;

-灵活定制策略规则和规则包动态加载,加快网管需求响应速度,快速交付;

-搭建能力开放平台,用户定制灵活度高,通过共创形成生态圈。

基站告警自愈场景就是上述流程实施的典型场景。运维人员通过将基站告警的处理流程编写为策略规则,策略框架完成基站告警自愈。

极简开站,开站流程数字化

在开通流程中,4G/5G站点选择、勘测设计、集成实施、竣工验收等环节,采用数字化方式,使用统一的开通服务器进行部署,可实现4G/5G站点数据的对接匹配和开通过程的高效协同。统一开通服务器,基于开通工作流,将开通任务执行过程以及开通自检等流程自动化,减少开通工程师的手工操作,保证站点数据的对接匹配和开通过程的高效协同,实现流程数字化管理。比如PNP站点开通的工作流程可简化成如图4


统一开通服务器未来支持手机开站APP,提高基站开通的自动化程度,提高开通效率。

网络质量洞察,多维度自动化分析

-告警根因分析

告警根因分析,基于网络业务数据(告警、业务对象模型、网络拓扑等)和AI平台,实现网络故障的精准定位和溯源。告警根因分析能够在通信网络中实现对告警的实时采集和转换、集中监控,并对当前告警中的关键信息进行分析处理。

相比传统的故障溯源和故障处理,告警根因分析支持多数据源(性能数据、日志等)+侦测命令,使得故障溯源更加有效和实用,溯源结果也更加精确和具有可参考性;基于网络数据,智能化识别出业务知识和规则,可解决人工经验积累不足的问题。

-KPI异常检测

传统习惯基于固定阈值方式判断指标小区异常,阈值设置常要适应各局点、不同时期、特殊活动等场景,阈值靠人工经验维护,异常识别有效性和准确率都难以保证。

KPI异常检测是从大量时间序列KPI数据中,以智能算法分析关键指标(如RRC连接建立成功率、E-RAB建立成功率、小区无线接通率等)时间序列的变化趋势,快速实现智能识别异常,及时发现话务突增突降(潮汐)、节假日现象对系统的影响,使得运维人员更精准地掌握网络性能,降低误报和错报异常,提升运维效率和质量。

-TOPN差小区分析

系统基于模型驱动,隔离不同制式的差异,结合忙时和性能、告警、配置三类数据进行关联分析:自动识别问题小区,并快速提供重点问题小区(TOPN)列表;自动给出问题小区的问题类别及对应的根因类别、根因权重和分布;某些场景确定关联告警问题,给出参数修改建议,并自动触发参数修改以快速解决问题。

-天线权值智能赋形,优化覆盖

天线权值自适应智能赋形,是系统通过复杂的数据分析和AI计算进行天线权值的自动调整,整个流程构建了一个“权值优化、权值生效、网络评估、权值回退”的闭环流程。其中,权值优化还可以分解为如下动作:自动组建小区协同、基于采集的UE数据进行数据分析、利用AI算法计算整体最优权值。

天线权值智能赋形在提供精准和快速的小区覆盖服务的同时,还可以减少小区间的干扰。天线权值优化覆盖,根据不同的应用场景和不同实施算法,采用不同测量优化机制,完成天线权值自动化调整。应用场景分为体育赛事、演唱会等场馆场景和商场、学校等通用场景。

本文介绍了新一代无线UME网管的核心管理能力和支持4G/5G融合运维自动化的几个典型场景。随着4G/5G网络商用推进,新业务场景落地,网络管理运维的复杂度和自动化程度越来越高,我们将紧跟业界发展,适时推出业界领先的网络管理运维的整体解决方案。

分享到:

 选择国家/语言

Global - English China - 中文