专题导读

发布时间:2023-07-25 作者:赵慧玲 阅读量:

 

      随着中国“东数西算”工程的不断发展,由中国电信运营商提出的算力网络技术逐渐成熟,其行业标准也持续成为产业界和学术界的研究热点。

      算力网络有哪些规划和实践?算力度量的研究进展如何?算力网络资源调度策略如何实施?算力网络路由策略应该如何考量和实践?算力网络的云边端协同调度技术研究进展如何?算力网络智算中心的关键技术有什么主要挑战?本期专题邀请了算力网络领域的专家进行撰稿,从不同的角度论述该领域的研究进展及相关成果。

      《东数西算场景下的算力网关研发及实践》提出了以算力网关相关技术为基础的算力网络形态,给出了算力网关组网的技术方案和路由方案,实现算力资源最优调度。文章特别阐述了运营商骨干和省网两个层面的具体建设实施方案,通过现网实践验证了算力网关技术方案的有效性。《算力网络四面三级算力度量技术体系》认为算力度量是算力网络的关键要素之一,算力度量要求量化异构算力资源并多样化业务需求,从而建立统一的描述语言。文章提出四面三级算力度量技术体系,同时还探索了在算力路由决策中网络按需进行算力信息传递等关键技术。《东数西算下面向业务的路由策略分析与探索》介绍了算力业务的需求指标和分类,分析了现网流量对东数西算业务路由策略的影响,研究了算力业务的路由策略,并提出了基于业务属性与算力资源分布的混合式路由策略技术方案。针对算力网络的低时延传输需求,《面向算力网络的多路径时敏优先调度机制》提出了多路径时敏优先调度机制,设计了基于强化学习的多路径低时延转发调度算法,并在转发出端口设计了等级与队列自适应映射算法,以减少低时延应用的排队时延。《算力网络资源协同调度探索与实践》详细介绍了一种算力网络资源调度的技术架构和系统功能,并针对用户差异化需求下多层次算力资源的弹性灵活调度问题,设计了一个算力网络资源协同调度平台。《面向算力网络的云边端协同调度技术》介绍了分布式云边端算力的发展趋势,探讨了融合云边端的协同网络技术架构和关键技术,给出了基于分布式强化学习的云边端协同网络中的流量调度模型,并通过仿真实验验证了所提协同流量调度方案的有效性。《一种面向服务的算网路由架构方案》分析了算力路由在IP分组网络面临的主要问题,提出了一种基于服务标识的算力路由技术,其核心思路是引入独立于IP主机地址的服务标识,并构建用户与算网系统之间、网络与业务之间、网络与算力系统之间的简明高效互通接口。《通用在网计算系统架构及协议设计》论述了通用在网计算的架构和主要应用场景,介绍了使用SRv6协议的实现流程,认为在网计算技术在不断成熟发展的同时,仍存在一些问题和挑战。《大规模语言模型的跨云联合训练关键技术研究》介绍了大规模语言模型跨云训练的主要挑战和关键技术,通过采用模型分割、拆分学习、跨云协同、压缩通信和模型复用等关键技术,能够有效解决跨云训练过程中可能出现的算力和数据不足的问题,并提高训练速度和效率。ChatGPT的出现表明智能算力占比将会大幅度提升,因此本期特别约请了智算中心网络的专家撰写了《面向新型智算中心的全调度以太网技术研究与思考》一文,探讨这一领域的技术发展及挑战。

      算力网络目前还处于发展阶段,仍需要进行不断探索和实践。本期文章汇聚了各位作者现阶段的研究思路及成果,希望能给读者带来有益的收获与参考。在此,对各位作者的积极支持和辛勤工作表示衷心感谢!

在线PDF浏览: PDF