智能体互联网(IoA)构建:核心技术与网络演进

发布时间:2026-03-27 作者:中兴通讯 吉晓威

        2025年,中国AI应用市场延续了“高位倍增,强劲渗透”的态势,月活跃用户规模从2024年的1.35亿增长到5.44亿,一年内翻了两番。以OpenClaw为代表的自主智能体兴起标志着AI应用逐渐从“单点工具”向自主协作的“社会化群体”演进。这种演进本质上是技术、需求与进化规律共同驱动的结果:技术层面实现了从next-token-prediction(下一词预测)到next-state-achievement(下一状态达成)的跨越。前者决定了对话式AI仅能聚焦单一文本生成、简单问答等闭环任务,受限于领域精度不足、缺乏自主任务调度与状态适配能力,无法应对跨环节、跨模态的复杂场景;而随着AI价值向产业级流程化应用落地,市场对跨节点协同、高容错性的需求,倒逼技术向next-state-achievement升级。依托该模式,可实现多智能体间的状态感知、分工适配与数据互通,再叠加大模型的任务规划能力、协作算法及分布式算力架构的支撑,真正具备复杂协同能力。

        传统互联网/物联网(Internet/IoT)本质上是由人类驱动的“信息互联网”,其核心功能是实现人、机、物之间信息的连接与传递;而随着AI应用的爆发式发展,智能体不再是孤立的工具,而是智能数字社会的“公民”,智能体互联网(internet of agents,IoA)应运而生,智能体间的协作,也将开启前所未有的、高度动态且语义丰富的通信流量新模式。

 

智能体互联网的挑战与核心功能

 

        构建一个开放、可扩展的智能体互联网,首先需要为其建立一套基础性的“社会运行规则”。这套规则需要解决几个根本性问题:在一个拥有海量、异构智能体的世界里,如何唯一地标识每一个智能体?如何让一个智能体能够找到另一个具备所需能力的智能体?如何确保他们之间的交互是高效、可信且安全的?如何让他们能够跨越不同平台和框架的壁垒,理解彼此的意图并高效协同完成任务?

        这些挑战催生了IoA的核心技术架构,其核心能力可以概括为四个层次:智能体标识与发现层、智能体认证与安全层、智能体交互与协作层,以及底层承载网络。前三层构成了智能体交互的Overlay层,而最后一层则是所有这些交互得以发生的物理基础。当前针对如何实现上述功能,国际和国内的产业界学术界提出了两种差异显著的技术哲学和实践路径,分别以AGNTCY框架和智能体网关为代表。

        本文聚焦于与承载网络关联密切的“发现”与“路由”问题的解决方案,分析两种框架下的实现机制,并分析由此引发的网络从“连接管道”向“智能协作承载平台”的演进中的关键技术要求。

 

AGNTCY框架

 

        AGNTCY是由Linux基金会托管,得到思科、谷歌云、戴尔、红帽等科技巨头支持的开源项目,其目标是成为智能体互联网的“TCP/IP套件”。其核心思想是在现有的TCP/IP网络协议栈之上,构建一个专属于智能体的、标准化的应用层基础设施,其构成组件如图1所示。

        智能体间的发现主要通过“智能体目录服务”(agent directory service)的中心化或分布式应用服务来实现。每个智能体启动时,会向这个目录服务器注册自己的唯一标识、功能描述以及当前所在的网络位置(如一个API端点域名)。ADS维护分布式哈希表(DHT,distributed hash table),用于高效查找与检索目录记录,DHT将智能体技能映射到记录标识符,从而可根据能力快速发现相关智能体。智能体间的消息路由由SLIM(secure low-latency interactive messaging)实现,通信客户端(智能体)定义采用4段式结构:organization/namespace/service/client,由SLIM节点(SLIM node)从ADS同步到DHT后,实现智能体间的点到点E2E消息和群组E2EE消息转发。

智能体网关

 

        智能体网关基于承载网络自身进行深度革新,在国内受到业界广泛关注。其核心理念是:为了满足智能体间通信对确定性、安全性和效率的极致要求,需要在网络的关键位置(如城域网边缘、数据中心出口)部署专用的智能体网关。智能体网关不是简单的应用服务器,而是一个深度融合了网络转发、身份认证、语义解析和策略执行能力的智能节点。

        智能体网关改变了传统的网络寻址范式。在传统IP网络中,路由基于IP地址(设备位置),而智能体网关致力于实现基于“智能体身份标识”的寻址,这意味着一个智能体在通信时,只需指定目标智能体的身份ID标识,而无需关心其当前运行在哪台服务器、IP地址是什么。智能体网关负责维护身份与位置的动态映射,并完成报文的转发。

        更进一步,智能体网关追求在网络层实现语义感知路由:深度解析或关联智能体交互流中的元数据,理解当前通信的任务类型(实时对话、文件传输或视频生成),并基于这些语义信息以及网络实时状态做出更优的路由决策。比如确保两个智能体间的实时对话流量被调度到低时延路径上,而大文件传输任务则被引导至高带宽链路。这种机制将网络提供的“尽力而为”服务提升为“语义驱动”的差异化SLA保障。

 

智能体互联网框架及网络的新需求

 

        结合AGNTCY与智能体网关两种设计思想,智能体互联网的框架可以提炼为图2。

 

        AGNTCY与智能体网关两种设计思路,都是在Overlay网络层设置节点完成语义翻译和语义路由,但在实现细节上存在很大区别:AGNTCY框架下各智能体需要将相对成熟的智能体通信协议(模型上文协议MCP、智能体到智能体协议A2A等)用SDK转换为SLIM消息,由SLIM Node根据消息头中的通道(channel)信息完成E2E或E2EE转发;智能体网关则基于原生MCP、A2A协议,由智能体网关完成语义翻译和语义路由,但对智能体自动发现、技能(skills)的统一定义等方面还待完善。无论哪种路径最终成为主流,多智能体的协作互联都对网络提出了清晰的新需求:

        首先,网络需要从“位置寻址”向“身份寻址”演进。以IP地址为核心的寻址体系无法适应智能体动态迁移、多实例并发、群组通信的特性。网络必须发展出能够理解并路由“身份标识”的新机制,实现身份与位置的解耦。

        其次,网络需要具备语义感知与语义驱动的能力。未来的网络流量引导和转发不能只看IP和端口,还需要能识别流量的业务内涵和优先级,从而进行差异化的资源调度和服务质量保障,这是实现智能体高效协同的基石。

        第三,内生安全必须成为网络的默认属性。智能体直接操作用户数据和关键业务,其通信链路必须是可信的。网络需深度融合零信任架构,实现以智能体身份为中心的动态微隔离、持续认证和加密传输,确保每一次交互都可验证、可审计。

        再进一步看,Underlay网络本身需要完成“智能体化”的演进升级,作为提供网络差异化承载能力的“网络智能体”参与到业务工作流中,将差异化的SLA承载能力封装成不同的skills,与其他业务智能体通过MCP/A2A/RPCoSLIM等协议进行交互,完成完整工作流的智能化闭环。

        智能体互联网的构建是将智能从孤立节点解放出来,连接成智慧网络的过程。可以预见,未来的网络将不再是隐藏在应用之下的隐形基石,而是化身为智能体数字社会中有感知、会思考、能行动的“智能协作者”。智能体互联网的目标,不仅是一个更快的网络,更是一个能孕育和承载群体智能的新一代数字基础设施。