随着大模型技术的爆发,智能体正从“尝鲜”走向“常用”,成为AI应用的新范式。然而,从通用场景跨越到高门槛的工业场景,AI面临着严峻的信任鸿沟。工业任务往往具有长周期、多工具协同的特性,这要求智能体必须具备强大的“长程推理”能力。但在长链条的决策过程中,任何一步出现的“幻觉”或逻辑断裂,都可能导致严重的生产事故。因此,如何在保持长程推理效率的同时,彻底消除幻觉,实现决策可审计,成为工业智能体落地的“最后一公里”难题。
复杂任务中的“信任与效率”困局
工业场景的复杂性常表现为任务的“长程”特性,即任务跨度长、涉及工具多、步骤繁杂。智能体在执行此类任务时,面临三大行业级痛点:
Co-Sight双引擎:破解工业长程推理难题
传统依赖全链路重复验证的方法计算成本高昂,效率随任务复杂度下降。为破解这一难题,中兴通讯创新提出Co-Sight智能体开发平台,通过构建“冲突感知元验证(CAMV)”与“基于结构化事实的可信推理(TRSF)”双引擎闭环机制,在大幅降低算力消耗的同时,将推理的准确性和可审计性提升至工业级标准。
如图1所示,Co-Sight构建了一个包含多个专家智能体与元验证智能体的高效系统,通过冲突感知元验证与基于结构化事实的可信推理,精准破解当前智能体在长程推理中“验证成本高、逻辑不透明、证据不可追溯”的难题。
TRSF:解决长程推理中的记忆瓶颈
在工业场景中,跨周期复杂任务常因“记忆丢失”或“逻辑断裂”而受阻。Co-Sight通过基于结构化事实的可信推理机制(Trustworthy Reasoning with Structured Facts,TRSF),构建了一个持续更新、可信且可溯源的“事实基座”。
TRSF引入三级上下文压缩管道,将海量、异构的工具输出转化为高密度结构化事实:
通过三级压缩,TRSF将长文本的信息密度提升100倍,支持智能体“断点续做”。无论任务跨天或跨周,都能实现“随时存档、随时重启”,推理过程不再因中断而失效。
CAMV:实现高可信验证
核心业务容不得“AI幻觉”,每个决策都必须“可审计、可追溯”。Co-Sight通过冲突感知元验证机制(Conflict-Aware Meta-Verification,CAMV),将验证视为“证伪”过程,而非全面重验。
CAMV的核心思想是:仅在专家智能体输出存在分歧的“最小冲突集”上投入计算资源。其验证过程包括4个步骤:
通过精准投放计算资源,CAMV将验证成本从全链路降至关键点,算力需求降低50%,幻觉率降至0.3%以下。
成果与展望
Co-Sight通过“零部件车间(预置原子能力)+总装车间(可视化编排)”模式,实现“用AI生产AI”。同时,Co-Sight已开源智能体三层交互协议,并在GAIA、HLE评测中连续蝉联第一。
在实际应用中,Co-Sight已成功构建工业级通信数智人,实现多智能体高效协同。以中兴通讯与中国移动的合作为例,双方在“点金行动”中验证了31个高价值场景,涵盖节能、业务开通、故障定位及处置、网络性能优化等。
未来,中兴通讯将持续优化Co-Sight框架,探索其在智能客服、研发辅助等场景的深度应用,推动AI应用向“可信”迈进,为行业智能化升级注入新动能。