中国移动拥有超过10亿的移动用户,是全球最大的移动通信运营商,管理运营着全球规模最大的5G网络。作为移动信息现代产业链链长,中国移动积极承担国家科技创新工作,推动产业链的协同发展和技术创新。自智网络作为移动信息现代产业链中的关键技术方向,是产业首批设置的十大子链之一,其目标旨在通过AI智能化技术提升网络运维效率,实现网络的自动化和智能化,加快向高阶自智网络演进。2024年,中国移动面向各省份分公司和行业合作伙伴发出自智网络子链联合攻关命题,号召业界聚焦AI前沿技术,凝聚合力解决自智网络瓶颈问题。
随着通信技术的飞速发展,网络规模和复杂度不断增加,维护工具和手段的离散化以及经验知识的分散化,使得运维资源整合与协同效率受到限制,如何加速故障识别、精准定界定位、高效调度故障处置流程、促进故障闭环管理,同时减轻运维人员的工作负荷,成为亟待解决的重大挑战。
中国移动山东公司携手中兴通讯积极参与自智网络子链,组建项目团队开展AI网络运维大模型赋能网络故障监控创新研究。
智算软硬一体化,筑牢大模型应用基石
缺少GPU资源成为大模型应用落地的关键风险,为此项目组多方协调,组织智算专家深度调研组网、工勘情况,深入讨论,最终形成全栈智算解决方案。从发起需求、方案规划到落地仅用45天,为大模型创新应用筑牢智算基石。
中兴通讯提供从算力、网络、能力、智力到应用的全栈智算解决方案,满足不同场景下的性能、成本和服务的差异化需求。智算一体机通过集成高算力硬件、易用的训练推理平台及主流大模型,解决大规模AI模型商业化落地的“最后一公里”难题。
通过软硬协同优化,智算一体机能够最大限度地释放GPU算力,确保AI应用的卓越性能和高效性。智算一体机全栈赋能,降低开发门槛,提供从数据准备、模型训练到部署与推理的全流程工具链,极大降低了企业开发AI应用的技术门槛。
智算一体机适配中兴通讯星云通信大模型、业界主流开源大模型并支撑RAG服务本地化一键部署,保障运营商运维数据安全与隐私,实现全链路数据加密,结合身份认证机制,有效防止未授权访问,面向应用提供安全、可靠、稳定的推理服务接口。
探索“AI+”故障监控技术创新之路
中兴通讯围绕星云通信大模型引擎提出大小模型协同、多智能体协同,赋能“AI+”故障监控场景,实现更精准的故障识别与定界定位分析、更高效的串联流程加速故障闭环、更智能的意图交互运维体验,释放运维人工负荷。
如图1所示,方案创新采用二级意图路由策略,通过总控智能体进行意图识别和路由、流程控制,将任务分发到识别、分析、调度、评估等各个业务智能体,相应的业务智能体来完成具体的任务并将结果返回给总控智能体;总控智能体判断是否进入流程下一环节,协同配合来驱动故障流程闭环。同时,为了降低智能体协作间的误差累积,采用从API向LPI(language programming interface)演进范式,智能体间通过LPI进行协同交互,提升多智能体之间协作的准确性。
在事件识别环节,构建识别智能体,创新采用大小模型协同技术,小模型负责数据动态聚合,大模型负责事件摘要生成,给出言简意赅的事件总结,实现1分钟智能生成事件。
在定界定位环节,创新采用故障知识+大模型因果推理思维链融合推理技术,综合故障案例库与告警数据进行综合推理,将多重原因共同作用导致跨域故障分析准确率提升至91%以上。
基于大模型打造调度处理智能体和智能问答助手,将故障知识、后台数据和原子API能力前移到掌上端,提升现场处置人员自助解决问题能力,提升前后台交互效率。
通过能力开放嵌入现网故障管理系统、调度系统、掌上运维,在IP网、传输网、动环跨专业故障场景试点验证中,可实现故障1分钟智能识别和生成,故障定界定位分析准确率达到91%,通过智能体协同减少人工参与工作量,驱动故障更高效闭环。
本项目实践入选TMF GenAI IG1345、CCSA中国通信标准化协会《网络运营管理大模型应用场景研究》、ICT中国2024优秀案例、2024年“兴智杯”金砖国家工业创新大模型赛道优秀项目奖、通信产业报网络运维创新力方案,为行业提供通信领域大模型应用实践参考。
未来,中兴通讯与山东移动将继续深入合作,全面拓展故障监控价值场景,加速故障监控机器人深度融入运维生产流程,降低监控和维护一线人员的工作负荷,提升运维效率,实现价值成效闭环。