智能化运维,我们能做些什么?

发布时间:2019-07-22 作者:何伟 中兴通讯 阅读量 :

5G正大踏步地向我们走来。5G优越的网络条件,将极大地改变个人用户体验,更给各行业带来全新的业务发展空间。5G网络要达到敏捷、自动、智能的网络运维,给网络服务提供商带来了极大挑战。在近几年的各全球行业顶尖盛会中,自动化、智能化已成为其中的热点议题。

对于业务提供商来说,压在身上的两座大山无非就是CAPEX(Capital Expenditure)及OPEX(Operating Expense)。只有持续不断地降低这两个指标,才能在行业中占据优势,取得先机。中兴通讯致力于为用户提供最便捷、最实用的运维理念及技术,帮助用户实现CAPEX及OPEX的大幅缩减。

以下从两个场景解析智能化的应用案例。

电信云到公有云的跨云协同——降低CAPEX

业务的多样性和复杂性必然会带来业务模型的不确定性,网络中每日、每周、每月的业务流量及质量属性均不相同。如果要保证客户感知的持续稳定,作为网络服务提供商,建网初期,只能考虑根据最大容量的要求来建设。然而,此方案必然导致资源大部分时间处于闲置状态,运营商为一年不会发生几次且无规律的潮汐流量而提前建网,浪费大量资源,这是不明智的做法。

中兴通讯提供的端到端跨云编排解决方案很好地解决了这个问题。网络建设初期,运营商可根据基础平均规模进行网络建设,通过数据中心内的资源调度灵活动态调整,满足大多数场景下的业务实现。当在某些特定要求下,电信云数据中心已无法承载相应的业务请求时,中兴通讯跨云编排系统CloudStudio可实现从电信云到公有云的协同调度,临时申请公有云的资源来承载相应的业务。根据客户的业务诉求仅需向公有云平台支付短期的租赁费用就可完成业务规模扩容,大大缩减运营商的CAPEX。

端到端根因分析——降低OPEX

随着网络结构的日益复杂化,系统节点、接口逐渐增多,运维的最大挑战来自对故障进行快速定位。网络智能化价值的重要体现就在于能够实现网络故障的快速定位。据中兴通讯某商用局点现网统计,一个普通维护人员的日常运维工作中,每天的告警平均处理量约为300条,这还不包含大量的无效指派及错误指派告警。可见运维工作花费大量的人力和物力。

中兴通讯RCA根因分析模型,基于开源学习算法Apriori(注:一种挖掘关联规则的频繁项集算法)、 Prefix-Span算法进行增强,形成超过8000条告警关联规则,尤其对于偶然性关联告警的识别率得到了大大提升。据统计,采用机器学习后,总体告警压缩率将达到90%以上,处理告警所花费的人员数量大大减少,故障定位的效率也将显著提高。除告警根因分析外,中兴通讯RCA根因分析算法还可对网络性能指标、异常日志等进行全方位的监控及分析。性能异常检测应用于云管网络系统,可提前发现系统异常,将故障消灭于萌芽状态。智能日志分析可帮助问题精准定位,也用于发现异常及预警。随着智能故障定位功能的应用与反馈,故障定位的方法也在持续拓展与优化,5G网络中的故障定位必将更加智能化。

未来智能化之路

5G网络的智能化之路,是从全人工方式,经半自动化到全自动化再到智能化的漫长的演进历程。在这一过程中,虚拟化、DevOps、大数据、机器学习、AI等技术全方位支撑着运维运营一步一步地演进。想让理想照进现实,就必须让这些先进的技术在实际场景中进行应用。运营商的需求是永恒的,即持续降低OPEX和CAPEX,同时又能全面保障终端用户的优质体验。中兴通讯致力于协助运营商将先进的智能化技术运用到日常的运维运营工作场景中。运用多年积累的电信行业经验,中兴通讯正在为全球超过50家运营商提供智能化运维综合解决方案及应用。

畅想未来的某一天,“建一条企业专线”、“开一场演唱会”等专项需求能被自动创建的定制化网络即时满足。智能化运维,我们可以做得更多。