基于Co-Sight Pro的自主决策型网优专家:从“经验固化”到“知识进化”

发布时间:2026-06-01 作者:中兴通讯 廖开蒙,倪华

        随着5G网络复杂度跃升,传统依赖“专家经验+硬编码”的网优模式已无法应对经验孤岛、数据黑盒与进化断层的核心挑战。本文提出基于知识生命周期驱动的自主决策型网优智能体实践,重点阐述Co-Sight Pro动态规划框架如何依托知识工程(全景图谱、TIR评测集、动网记忆),实现从“单点工具调用”到“多步自主决策”的范式跃迁,重塑网优生产力。

 

网优智能决策的核心痛点

 

        在当前的网络优化作业流程中,尽管自动化工具已部分介入,但在面对复杂工单处理时,仍面临三大难以逾越的鸿沟:

  • 经验孤岛与决策僵化:专家经验难以复制,每次优化都要重新探索;传统硬编码工具灵活性差,无法适应复杂多变的网络环境,且知识传递依赖人工,效率低下且容易失真。

  • 数据黑盒与不可解释:大模型幻觉难以控制,导致决策结果不可靠。决策过程缺乏透明度,难以获得专家信任;模型输出与网络优化目标(如KPI对齐)不完全匹配,仍需人工干预。

  • 进化断层与闭环缺失:运行态的Badcase(失败案例)无法自动反哺生产态。从问题发现到解决方案应用的迭代周期长,导致同样的问题反复出现,网络无法实现“越用越聪明”。
     

        要解决上述痛点,必须从传统的“规则+工具”范式,转向以知识为核心驱动力的知识驱动型开发范式。

 

知识驱动的自主决策架构

 

        自主决策型网优专家核心是以Co-Sight Pro为动态规划引擎,以知识工程为基石,构建完整的“感知—分析—决策—执行—进化”闭环。其总体逻辑遵循知识生命周期(见图1):

  • 知识生产:通过自动化构建全景知识图谱、TIR(test-driven intelligent refinement)评测集及“动网记忆”,将原始数据与专家经验转化为结构化知识。

  • 知识驱动:通过领域知识注入精调模型,由图谱驱动Co-Sight规划,结合思维链(CoT)推理,实现可解释的智能决策。

  • 知识回流:运行态Badcase自动挖掘,驱动TIR代码迭代与模型增量训练,形成知识飞轮。

Co-Sight Pro:自主决策的“大脑”

 

        Co-Sight Pro是区别于传统固定工作流的面向Agentic AI的核心组件。传统工作流僵化,无法应对网络突发变化,而Co-Sight Pro实现了动态规划和执行,并基于TIR技术,实现工具精准使用。

  • 图谱驱动的动态规划
     

        当接到工单任务(如“处理4G/5G负荷不均衡”)后,Planner Agent首先挂载知识图谱;通过自然语言查询图谱,获取“事件子图”和“根因子图”,图谱提供了“上帝视角”,展现“现象—事件—根因”的关联;根据图谱查询结果,Planner Agent自主编排出一张可并发执行的DAG(directed acyclic graph,有向无环图),达成图谱驱动的自主规划。

  • 反思与重规划机制
     

        Actor Agent执行规划好的诊断路径。在执行过程中,Agent实时观察执行结果与网络状态,若发现预期外的变化(如工具返回Null或出现新告警),立即触发反思与重规划,动态调整后续步骤或智能终止任务,确保优化收益正向。

  • 与TIR工具的协同
     

        在诊断链中,Co-Sight调用基于TIR技术训练的根因诊断工具。TIR工具将专家经验代码化,不依赖GPU,支持高并发运行。当TIR工具无法给出结论时,由精调模型进行托底判断,保障诊断覆盖率。

 

知识工程:支撑自主决策的“基石”

 

        Co-Sight Pro的自主决策能力并非凭空产生,而是依赖于强大的知识工程体系提供的“养料”(见图2)。

 

  • 全景知识图谱:决策的“先验知识”
     

        网优涉及海量参数,算法文档篇幅大,引用关系错综复杂。知识图谱自动化构建了“现象—根因—事件”的关联。Co-Sight Pro通过查询图谱,能迅速锁定需要执行哪些核查项(如“事件核查”和“30个根因诊断工具”),为规划提供结构化输入。

  • TIR评测集:诊断的“精度保障”
     

        使用大模型推理根因,依赖GPU且推理成本高。TIR技术通过“智能数据生成+代码自进化”,将专家经验固化为高精度代码。在4G/5G负荷不均衡场景下,F1 Score可达100%。这使得Co-Sight Pro在调用诊断工具时,能获得可靠、高效的结论,且过程完全可解释。

  • 动网记忆:进化的“经验养料”
     

        运行态经验无法沉淀,迭代周期长。动网记忆记录了Agent每一次操作的上下文(工具调用历史、策略成败、网络状态变化)。这些非结构化轨迹被转化为结构化的CoT语料,用于后续的模型精调。这使得Co-Sight Pro能基于历史经验,在面对类似场景时做出更优的路径规划。

 

关键场景与业务价值

 

        基于Co-Sight Pro的自主决策能力,在网优工单处理全流程中实现了质的飞跃。

  • 工单识别:将领域知识注入下的模型精调,通过交互式意图引导,多轮澄清模糊意图,解决列头语义多样、对象提取难问题。

  • 问题复核:基于TIR算法核查和精调模型托底,自动调用TIR工具扫描实时状态、快速过滤,避免大量假异常/已自愈问题浪费人力。

  • 根因诊断:基于图谱驱动Co-Sight规划、CoT推理,使用Agentic Reasoning、TIR工具,构建可解释诊断链,避免黑盒推理、不可信。

  • 方案生成:使用大小T融合多目标寻优、孪生验证,自动合并冲突方案,解决多根因冲突、难以合并问题。

  • 执行闭环:基于一键下参、智能回退机制,实时监控KPI,KPI恶化时自动触发回退,避免僵化执行、负优化风险。

  • 经验沉淀:基于动网记忆、闭环反馈,进行Badcase回流,驱动TIR代码/模型在线进化,避免问题反复出现。
     

网优业务成效如下:

  • 工单优化率:70%+(目标2026年底>90%);

  • 工单自闭环率:20%(目标2026年底>30%);

  • 工单处理时延:<4小时(目标缩短至<2小时);

  • 根因诊断准确率:通过TIR保障,场景内达≥99%。

 

总结与展望

 

        基于Co-Sight Pro的自主决策型网优专家从知识的“使用者”向知识的“学习者和进化者”转变。

        当前,已实现了在容量、质差场景下的动态规划与根因诊断,通过TIR技术解决了算法精度与资源消耗的矛盾,通过动网记忆为系统进化奠定了基础。

        后续将继续向L4级自智网络智能体高度自智迈进。在技术上,将攻克长链CoT推理、TIR代码在线更新、多智能体协同等难题;在场景上,将全面覆盖覆盖、质差、干扰场景,实现跨UME/多厂商适配。

        最终,将构建一个自感知、自诊断、自优化、自进化的自愈网络,真正实现“人在环上、流程监督”的运维新范式,以知识为核,以智能为翼,引领行业变革。