智能体工厂实践:工业级Agent的敏捷生产之路

发布时间:2025-06-23 作者:中兴通讯 巫江涛,付林舟

        当Manus作为首个通用智能体引发全球关注时,智能体技术正经历着从实验室探索迈向工业化生产的关键跨域阶段。为了应对传统智能体(Agent)面临的开发周期长、质量标准不一、资产难复用三大痛点,智能体工厂应运而生。中兴通讯构建了业界首个实现“生产-测评-优化-闭环”的工业级Agent平台,以标准化、模块化生产推动智能体开发进入工业时代。

 

Agent工厂核心架构与生产模式

 

        工业级Agent工厂基于云原生架构,底层支持异构计算如国产GPU和推理卡,为上层大模型应用提供Agent的设计开发和运行的全流程支撑(见图1)。

 

RAG工作台:知识装配车间

        RAG工作台帮助用户快速构建基于检索增强生成(RAG)技术的应用。用户可通过工作台轻松完成知识库构建,包括语料上传、智能切分、Embedding模型选择等关键步骤,并结合测试集进行评测优化。同时,知识检索功能支持自定义工作流,灵活调整检索策略,提升RAG系统的响应质量。通过RAG工作台,用户可一站式完成知识管理及效果评估,快速打造高准确率、高性能的RAG应用。

 

WorkBridge工作台:自然语言与API的智能连接枢纽

        WorkBridge工作台是桥接原子能力、扩展大模型能力边界的开发工具。它通过自然语言编程接口(LPI)将自然语言精准映射到现有API,通过自然语言驱动API执行,实现“语言即命令”的智能化调用。其核心功能包括:

  • LPI管理:支持LPI的创建、优化、评测及发布,确保自然语言与API的映射准确可靠。
  • 技能管理:将多个LPI组合成可复用的业务技能,提供技能的全生命周期管理。

        WorkBridge工作台有效降低了开发技术门槛,加速智能应用开发,成为自然语言到接口调用(NL2API)技术的工程实践典范。

 

Agent工作台:智能体的终极装配站

        Agent工作台提供3种方式满足不同用户的Agent装配需求:基于预置模板的快速开发、AI辅助的智能构建以及自定义的专业开发。

        在开发过程中,工作台提供可视化的配置界面和智能对话辅助功能,支持开发者快速完成智能体角色定义、知识库关联以及工具集成等核心配置。开发者可通过手动测试或自动生成测试集的方式验证智能体的表现。

        此外,工作台还配备了强大的评估优化功能,提供多维度指标分析和详尽评测报告,支持开发者持续调优。同时,系统还提供智能优化建议功能,通过AI技术辅助分析帮助开发者快速提升智能体性能。

 

双态协同:工业级Agent生产流水线

        双态模式赋能智能体工业化生产:“开发态”通过三大工作台(即RAG、WorkBridge、Agent)协同完成知识生产、技能开发及智能体组装,经严格测试后进入资产中心;“应用态”则依托资产中心实现一键部署,形成从原材料到成品的标准化流水线,在兼顾质量与效率的同时,为AI应用规模化落地提供了可靠支撑。

 

深度实践:通信网络故障监控Agent炼成之路

 

        传统监控系统存在故障发现滞后、根因定位准确率低、跨系统调度效率低下等问题,亟需通过AI技术构建智能化的故障监控系统,实现从被动响应到主动预防的质变。

        中兴通讯采用“知识-技能-Agent”递进架构,打造通信网络故障监控专家。

 

知识工程建设:构建智能基础

        在通信网络故障监控场景中,为使系统具备高效、精准的故障交互问答能力,需构建一套涵盖多领域故障定义和场景化处理指引的知识体系。具体实施包含2个重点:

  • 知识库构建:支持文本/Word/PDF导入。重点建设故障知识库(包含故障定义标准、故障处理指南、告警处置手册等)与设备信息库(设备全称与简称映射关系),并通过RAG工作台完成文档导入和智能分片处理。
  • 检索机制设计:采用向量+关键字混合检索模式,利用RAG工作台可视化流程编排功能,实现检索结果的智能重排。

 

能力组装:打通系统经脉

        监控中心工程师经常需要在多个系统间频繁切换以处理故障,为解决此问题,中兴通讯将能力开放平台(获取告警、性能指标、日志等数据)、工单平台和单域工作台(拓扑查询)的API进行自然语言转换封装。使用Workbridge将API转为LPI,组合多个LPI为完整技能。目前已封装15个外部系统API,支撑故障监控全流程闭环处理。

 

Agent生产:打造数字专家团队

        中兴通讯为故障监控场景打造了故障处理“特战队”,包括:故障识别Agent、故障分析Agent、故障调度Agent、报告生成Agent。

        以故障分析Agent为例,其核心功能是通过多维数据分析实现故障定界定位。在实际网络运维管理中,不同领域故障分析思路也有所不同。例如:处理数据网故障需综合机房设备、传输链路等维度,而网络云故障则需逐层分析硬件、虚层至网元。我们将定界定位方法设计为思维链存入知识库,然后为Agent配置思维链知识库,并配置告警分析、日志分析等技能。同时,Agent装配后需经过测试迭代优化,达标后发布至资产中心,再投入生产环境使用。

 

落地成效

        在某省运维中心,中兴通讯故障监控专家“数字员工”实现了7×24小时全天候值守,可达到1分钟精准识别故障,复杂故障定界准确率达91%。中兴通讯故障监控专家目前正纵向拓展专业领域,横向扩大应用区域,持续提升智能运维覆盖面。

 

        未来,Agent工厂将加速向自动化与专业化深度发展。在自动化方面,通过AI技术实现从需求分析到性能优化的端到端全流程闭环,降低开发门槛;在专业化方面,以通信领域为蓝本构建预定义Agent模板库,实现开箱即用,加速智能体应用部署。随着智能化技术的演进,Agent工厂有望成为企业智能化转型的基础设施,释放AI普惠价值。