多标签分类路径计算技术

发布时间:2018-08-27 作者:王超,陆钱春,李锋(中兴通讯) 阅读量:

5G技术作为下一代网络的技术标准,主要用于满足高速发展的移动互联网和物联网业务的需求,它需要具备低成本、低能耗、安全可靠等特点,网络传输速率和网络服务质量相比4G技术要提高10到100倍。传统的路径计算技术无法提供这种全新的用户体验和优质的服务,一系列的重大变革和技术创新应运而生,中兴通讯适时推出多标签分类路径计算技术。


多标签路径计算系统架构

中兴通讯多标签分类路径计算技术的系统架构如图1 所示。


业务特征集合划分
在大规模网络环境下,可以将网络划分为多个子网,每个子网中,将输入的业务特征集合划分为训练样本特征集合和测试样本特征集合。训练样本的业务特征采用传统的路径计算方法得到业务路径作为分类的类标签,采用有监督的分类方式对训练样本集合业务特征进行多标签分类的模型训练。测试阶段,对测试样本进行分类测试,分类的结果就是为每组业务特征分配到的业务路径。

数据预处理
数据预处理是指对业务特征数据的解析、清洗、规约等操作。数据的解析包括输入特征数据的格式解析和转换,保证数据能够被系统有效识别;数据的清洗主要是去除数据集中的噪声数据,防止对系统和算法的干扰,保证业务特征数据的有效性;数据的规约是在特定条件下,对数据进行有效的精简,降低系统负荷。

特征提取
业务特征集合中包含了很多的特征项,特征提取是从特征项中提取出有效的鉴别特征,从而能够将不同的业务种类识别出来,业务特征的鉴别能力强弱决定了业务特征项的优先级。

特征聚类
在有效的业务鉴别特征项中,业务的特征值是一组离散的数值集合。使用特征聚类算法对离散的数值集合进行聚类分析,进而得到离散数值集合的聚类中心点。寻找到聚类中心点的意义在于,分布在聚类中心点的近邻样本点可以由聚类中心点来表示,这样可以将同类业务聚合,异类业务分开,提高业务特征的分类识别率。

构造决策树分类器
经过特征提取和特征聚类后,业务的特征集合可以用来构造随机森林。随机森林是一组决策树分类器的集合,它会选取分类效果最好的一组业务特征作为树的根节点,根节点外的其他业务特征集合作为树的子节点和叶子节点,子节点的分裂值就是特征集合中的每个特征值,这样就形成了一棵决策树。

输出分类结果
使用测试样本对决策树分类器进行分类测试,可以直接得到分类结果,分类结果就是当前业务特征所对应的业务路径。

中兴通讯多标签分类路径计算技术的优势

改进的路径计算方法与机器学习算法结合
传统的路径计算方法如启发式算法在网络路径计算方法取得了很好的效果,但是在网络规模扩大到一定程度后,就会遭遇收敛慢、无法得到最优解,甚至无法得到解等一系列问题。在这种情况下,需要对传统的路径计算方法进行改进。

中兴通讯多标签分类路径计算技术将改进的路径计算方法与机器学习算法结合,有效解决了大规模网络环境下的路径计算问题,充分发挥了路径计算方法与机器学习算法各自的优势。

采用成熟流行的分布式、并行化技术和平台,提升计算能力
5G网络下,业务种类的多样化,传输速率的高速化,对网络的承载能力提出了更高的要求和标准。在这种背景下,网络中业务路径的计算量和传输的数据量都呈现指数级的增长。为了应对数据量和计算量的激增,各大公司相继推出Hadoop、Spark等主流的大数据处理技术和系统平台,为大数据分析、机器学习算法提供了很好的支持,实现分布式计算、并行化计算。此外,GPU的并行计算能力也有着非常优越的表现,这些技术都为多标签分类路径计算技术提供了卓越的技术支持和提升了算法本身的计算能力。

有效解决传统路径计算算法的性能瓶颈
传统路径计算算法在网络达到一定规模后,会因为算法本身以及机器性能等制约因素,出现严重的性能瓶颈。中兴通讯多标签分类路径计算技术通过机器学习算法而无需进行网络规模的全量计算,从而有效解决了传统路径计算算法在性能方面的瓶颈,由此,可以更快速精确地计算大网络规模的路径。

中兴通讯多标签分类路径计算技术相比于传统的网络路径计算技术,能够在大规模或超大网络规模环境下,快速精确地计算网络路径,为运营商开通、部署、调整业务提供指导和规划建议,对已有业务进行优化,实现负载均衡,网络的优化调整。同时,也将不断完善、创新、快速响应变化,全方位满足运营商客户的需求,打造一个全新的智能化的5G未来网络和AI+时代。