基于大数据的电信实时反馈闭环系统

发布时间:2015-02-01 作者:王德政,申山宏,程少飞(中兴通讯) 阅读量:

      在现代控制论诞生之前,对系统输出的控制,理论上是通过对输入的精确控制来实现。但由于系统误差,这种理论实现起来非常困难,在复杂系统中几乎不可行。基于这种困境,现代控制论引入实时的闭环反馈,可以让系统工作得更加稳定可控,促使现代工业生产质量产生质的飞跃。


  传统电信网络作为一个整体系统,一直缺乏相应的闭环反馈。对于这种规模级别的生产系统,从理论上说,缺乏闭环反馈将很难维持系统的稳定性。为了保证系统的稳定性与可用性,电信领域付出了惊人的努力。就如同在引入反馈之前,试图通过控制温度等一系列因素来控制轧钢厚度一样,电信系统也试图通过控制网络系统的各类参数,来保证整个网络的服务质量。同时,通过呼叫中心与路测来提供局部的、非实时的反馈。


  电信网络无论是对网络进行优化的努力,还是通过呼叫中心对客户的安抚,其成本不仅高昂,而且获得的收效也不理想。这样巨大的努力,最后导致的却是网络度量指标(KPI)很优秀,但用户体验(CEM)不佳的结果,尤其是针对承载了大量OTT应用的数据业务,更是如此。电信网络系统所面临的困境,在原有的理念框架下很难解决,迫切需要引入新的理念,以降低维护成本,提升系统稳定性。


  当前业界已经出现类似客户感知、SQM之类的概念与实践,但从理念层面仍然只是作为电信系统的一个局部的补充,而不是电信系统不可或缺的有机组成部分。从电信网络系统的层面来说,不仅数据的采集不够完整与严谨,最关键的是,其处理的结果也没有采用合适的方式导回电信网络系统,形成实时反馈。


  针对电信网络维护成本高昂,维护难度过高的现状,中兴通讯经过多年的实验,通过挖掘系统质量与系统参数之间关联性,进行模型构建与模型校准,并通过现场实验,验证了基于电信大数据的网络系统级别实时反馈理念的有效性。同时,通过对业务流的细分,将反馈环细化为针对网络系统的反馈环,以及针对客户体验的反馈环,有效提升了网络运维与运营效率。


  如图1所示,传统的电信网络,除了基础网络外,还有负责运维的O域(OSS域),以及负责运营的B域(BSS域),但缺少D域(未来的Data域)。由于缺少D域,传统的电信网络只能在O域构建基于网络设备的基础反馈环,即图1中的FeedBack1。该反馈环是O域接收基础网络中网元上报的故障告警、性能KPI等,发现并确认故障后,通过下发维护工单进行网络维护,以消除故障。该反馈环是面向网络设备的反馈环,可以即时发现网络设备的故障,并予以修复。该反馈环是整个系统中最基础的反馈环,其实时性要求较高,是小时级别(甚至分钟级别)的反馈环。


  

     FeedBack1仅能探测基于设备的故障,对于网络系统级、服务业务级的故障则很难发现。往往需要等用户拨打投诉电话后,才能发现服务质量的恶化,不仅增加了故障处理的周期,而且直接导致用户体验的下降。并且,大多数体验不够好的用户属于沉默的用户,只有少数用户会主动投诉。这些体验差的沉默用户,离网风险非常高,需要主动找出此类用户并加以关怀。


  在大数据相关技术成熟前,对于PB级以上的数据,传统关系型数据库几乎没有能力处理。由于数据存储处理能力的限制,电信网络中的信令数据与日志数据都作为低价值密度的数据而被丢弃。即使对于高价值密度的B域数据与O域数据,也由于数据存储处理能力的限制,导致烟囱式的系统数据难以集中统一,难以发挥数据的最大价值。当前由于云计算与大数据技术的发展,对于处理PB级以上的数据,已经具备技术可行性。同时,从数据处理的经济性来说,如果处理一个数据集所付出的成本难以获得相应的产出价值,则说明该系统不具备经济可行性。云计算与大数据技术导致数据处理成本急剧下降,传统“低价值密度”的信令数据与日志数据也因此而具备数据处理的经济可行性。可以如图1所示,将原来分散在O域的运维数据、B域中的运营数据,以及网络中的信令日志等数据集中整合在一起,集中存储、集中处理、统一建模,以此为基础形成D域。通过D域的数据整合,形成构建FeedBack2、FeedBack3与FeedBack4这几个高层次反馈环的关键部件。


  构建FeedBack2的目的,是为了给电信网络中的流量控制部件(如PCRF、ISG等)提供策略支持。当前的流量控制方案,要么仅仅依赖来自B域的信息,调整周期较长,不能依实时流量状况而调整;要么仅仅依赖DPI统计的实时流量信息,缺乏签约信息,所生成的控制策略有较大的局限性。综合B域中的用户签约与消费信息,以及DPI探针所统计的用户实时流量信息等,可以形成更为精确与实时的流量控制策略建议,反馈给流量控制部件,以便生成流量控制策略,并执行该策略。该反馈环也是实时性要求较高的反馈环,是小时级别(甚至分钟级别)的反馈环。


  构建FeedBack3的目的,是为了发现网络系统级别的服务质量恶化,避免传统网络中“KPI都很好,用户感受却很差”的问题。通过对网络信令、KPI等数据的分析,可以得出系统业务级别的SQM(Service Quality Management)以及用户级别的CEM(Customer Experience Management),通过实时监测SQM与CEM,FeedBack3可以在系统设备发生告警之前,就向O域反馈业务质量恶化的趋势并告警,从而在发生大面积的用户投诉之前就能够发现故障,并及时解决故障。该级别的反馈环可以是以天为级别(也可以是小时级)的反馈环,相较于传统以季度为周期的路测方式,引入该级别的反馈环将极大地缩短故障发现的周期,并节约大量的路测费用。


  构建FeedBack4目的,是为了提高运营的敏感度与运营效率。通过结合B域、O域、信令等数据,可以针对性地对高离网风险用户进行原因分析,或者对套餐是否受欢迎及其原因进行细化分析。B域甚至还可以在此反馈环的基础上进一步延伸,向电信基础网络下发相应的计费策略信息,实现更灵活的计费模式。该级别的反馈环是以月为级别(也可以是周级)的反馈环,相较于传统用户离网时再挽留的模式,通过引入FeedBack4,将提高运营的敏感性与运营效率。


  我们还应该看到,除构建网络反馈环外,数据在D域集中后,还可以开发更多的大数据应用(包括第三方应用),以充分挖掘数据中所蕴藏的价值,例如网络规划与扩容建议、终端使用分析、人流量分析、城市道路规划预测等。


  当前各运营商已经在现网上做部分的FeedBack2、FeedBack3、FeedBack4实验,但由于缺乏系统性的理论基础,标准化程度不高,多厂商对接困难,导致这些实验效果不佳。未来在理念层面,基于电信大数据的多层级反馈环,不应仅作为电信网络系统的补充,而应是整个系统的基本组成构件。在理念层面达到共识的基础上,需要业界共同推进相应的标准化工作与互联互通工作,从而构建效率更高、更易维护与运营的电信网络。