智能算网调度体系,打造高效泛在算力服务

发布时间:2023-02-06 作者:中兴通讯 朱堃 阅读量:

        为实现绿色节能,降低算力综合成本,“东数西算”国家战略正成为数据中心建设的顶层集约化建设的指导原则。“东数西算”通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化了数据中心建设布局,有效促进了东西部协同联动。目前落地的典型应用场景主要包括东数西存、东数西训、东视西渲等。同时,随着行业数字化转型的深入,为有效保障工业控制、元宇宙等实时性应用的落地,边缘计算也从汇聚边缘向接入边缘、超边缘甚至端边缘逐级下沉。算力从集中部署向东西向、南北向全面泛在部署的趋势越来越明显。

        但我们看到,尽管中西部地区数据中心在用机架数的全国占比已上升到39%,超过北京、上海、广东三个数据中心聚集区在用机架数的全国占比,但机器利用率不高,均衡发展,提升数据中心的利用率是急需解决的问题。同时,边缘计算场景下,云边、边边之间也无法做到跨云的资源编排部署以及业务的灵活调度,不能满足行业专网、车联网等分布式系统对基础设施一体化编排调度的要求。因此,在算力泛在部署的大背景下,如何实现算网一体的智能调度系统,将大规模、高性能算力真正打造为高效的抽象算力服务,有效提升资源利用率,同时满足应用敏捷开发、快速部署的要求,是目前尤需解决的重要问题。

 

算网一体的智能调度平台

        回顾历史,我们可以看到算力供给模式的三个明显阶段。在算力稀缺时代,算力服务强调集中供给,此时,计算资源效率是主要矛盾,时延、协同、安全尚不敏感,主要的技术关注点在于采用IDC、云来提升利用率、共享率以及集约化;在目前我们所处的算力相对丰富时代,服务延伸到差异化的多云,此时强调通过动态节能技术、东数西算以及云间互联带宽来降低成本,实现数据共享;在未来的算力丰富、泛在阶段,DPU(深度学习处理器)、NPU(神经网络处理器)、AI芯片等异构算力大量涌现,需要通过统一纳管屏蔽多样化异构算力,强调跨层跨域一致体验和协同服务,关注业务创新、数据隐私。从发展趋势也可以看到,算力供给的总体趋势强调的是系统性效率,而不是局部或单点效率的最大化、带宽和时延敏感。

        因此,算网一体的智能调度平台的意义重大。该平台的功能主要包括:

        - 算力映射:实现业务需求到算力服务的智能映射转换,有效地将应用对算力的需求,比如时延、帧处理能力等,智能映射为FLOPS、IOPS等算力服务度量值,大大降低应用开发的难度,满足应用快速敏捷的要求;

        - 算力原生:建立异构硬件的抽象模型,统一开发编译工具,通过屏蔽异构多样算力的差异性,减少用户跨架构编程的重编译和迁移适配的代价,使得应用只需要关注业务逻辑表达,无需关注计算在不同硬件上的不同实现;

        - 算力调度:实现南北向中心/边缘、东西向枢纽/边边全局调度,同时多应用混合部署满足智能弹缩,削峰平谷的要求;使得业务跨云敏捷部署及协同成为事实,同时大大提升资源的利用率。

 

算网调度路径

        随着算力感知网络技术的成熟,在算网调度方面,目前看来有两种可选路径(见图1)。

 

Network diagram

图1   智能感知算力调度路径

        第一种是传统的以云商为代表,云为中心、一云多网的云调网模式。网络为云提供连接支撑,并且根据云服务需求调整。用户首先选择云服务节点,云服务节点再根据资源状况或用户之间网络情况选择另一个云服务节点以及路径。该模式可以随时随地获取服务,不受接入网络限制,但是网络质量下降(如空口拥塞)只能在应用侧通过降低解码率等方式来适配解决。

        另外一种是以运营商为代表,网为中心、一网多云的网调云模式。网络同时提供连接和计算服务,可以根据用户需要实时匹配算力。用户首先选择网络节点,网络入口感知用户请求的算力服务和SLA要求,执行任务式服务分发到具体云服务节点。由于网络侧感知用户需求和链路质量,调度、调整资源更加实时、精准。但这种模式的服务范围受限在单一运营商网络的运营区域。

        目前看来,两种模式由于各有特点和局限性,将长期并存,满足不同场景的要求。

        随着千行百业数字化转型的逐步深入、技术的成熟,以及节能减排、“东数西算”等政策的引领,使得以网强算,以算促网,通过泛在算力提效降耗、实时算力保障服务体验、新型算力服务拉动网络流量,从算网解耦演进到算网一体的算力网络成为运营商建立差异化竞争力的利器。中兴通讯作为业界成熟的ICT方案及设备供应商,在“东数西算”建设中将发挥主力军作用,助力政府、企业打造智能高效的算力网络。