基于算力网络关键技术和算网融合典型场景研究

(整期优先)网络出版时间:2024-05-31
/ 3

  基于算力网络关键技术和算网融合典型场景研究

赖沛杰

广州市汇源通信建设监理有限公司

摘要:算力网络是以算力为核心,通过软硬件协同设计,对数据中心网络进行自动化、智能化、网元化的重构,提供强大算力支撑的新型网络架构。随着"大云化"和"云边端协同"的出现,算力网络正在向更加灵活、多样化的方向发展,这给传统的数据中心网络带来了前所未有的挑战:传统的集中式网络架构无法满足多种计算任务的需求,而且无法实现算力与业务之间的高效协同。因此,必须寻找更加灵活、多元化、可靠的架构,以满足不断变化的算力需求。

关键词算力网络;数据中心;算网融合;典型场景

一、前言

随着网络技术的发展,通信和承载网的融合趋势越发明显,网络能力融合成为必然趋势。在云网融合环境中,算力资源的动态调度策略对于实现高效的资源利用和优质的服务至关重要。传统的静态调度策略已经无法满足动态、多变的场景需求,因此针对动态调度问题,优化调度策略得到了越来越多的关注和研究。通过设计合理的调度策略,可以实现算力资源的高效分配和利用,提高系统性能和用户体验。

二、关键技术分析

(1)网络编排技术

通过采用云技术,我们可以将传统的业务流程和核心资源彻底分离,从而提升整个系统的性能。为了达到这种目的,我们必须拥有足够的容量来支持网络的优化和调度,并且利用云技术来优化数据库和互联网的架构。最终,我们将为用户带来更加有效、安全可靠的云计算服务。

关于算力建模以及服务编排可以分成三个部分,服务能力开放层,该部分需要包括镜像仓库、应用商店、函数服务、鉴权管理等,在编排调度能力层需要实现网络调度、算力调度以及存储的虚拟化,资源调度管理层则需要包含算力评估模型、网络资源池等,可以将业务运行需要的算力按照标准进行划分,从而在设计业务内容的过程中可以得到有力参考。

(2)网络承载技术

随着5G技术和云计算的发展,IPv6+已经成为一种可靠的解决方案,它不仅能够满足算力网络的灵活组网要求,还能够极大地提升用户体验。此外,算力网络承载技术也是一种有效的解决方案,它通过利用网络感知技术,可以有效地将算力与服务进行匹配,从而提高网络的性能和可靠性。对于算力网络系统而言,算力网关可以实现流量流向的转化,相比于其他信息网络结构,算力网络业务网关的下沉更加明显,在IPv6+技术的协助之下,可以进一步拓宽网络结构中可编程空间。在应用算力网络承载技术时,还需要针对业务链技术以及网络切片技术等进行开发和利用,主要目的是完善信息业务的部署,并在此基础上实现统一的资源管理和资源调度。通过利用数据中心的专业软件和电信运营商的IP控制能力,技术人员可以构建出一个高效的调度方案,从而实现对计算机网络的有效管理,并且可以将计算机信息资源有效地传输到各个角落。

(3)网络转发技术

传统的信息网络设备主要的工作模式是转控一体,该种模式无法满足算力网络运行的要求,在灵活性以及可编程性等方面都有待提升,目前,新一代可编程数据包处理芯片以及多种编程语言的应用,可以时效内针对数据包处理流程的全面定义,不仅可以结合算力网络的自身需求实现网络行为,同时,也可以实现对数据包架构和基本模块的设计,不会受到协议中的细节何况异常行为的限制。

(4)算力网络信息通告

算力通告模块主要用于收集并汇总各设备算力感知模块发送的信息并生成算力网络拓扑图,解决现有技术中缺少有效的实现算力网络中各节点信息通告与路由决策方法的问题,例如,某团队发明的算力网络信息通告与路由决策方法、装置及介质可以实施获取并存储算力网络中的各节点信息,并根据各节点信息为算力网络中各入口节点制定各自的下发信息,向各入口节点通告各自的下发信息,以使各入口节点接收通告给自身的下发信息,并根据接收到的下发信息为通过自身接入算力网络的业务进行路由决策。

(5)度量建模技术

为了深入探索算力网络的核心技术,我们必须完成相应的建模与分析,以确保采用统一的测试方法。为此,我们必须采取多种测试方法,以便更准确地评估各种测试方法的性能,并且根据当前的测试环境,确定最佳的测试方法,以及最佳的测试方案,以便更加精准地评估测试方法的性能。第一,尽管CPU、GPU、神经网络处理器等已经成为评估网络性能的重要参考,但由于各种处理器之间的差异,使得将它们的性能作为一个整体来评估,这一过程受到一些限制。第二,尽管一些研究已经提出了用来评估处理器性能的方法,但由于各种处理器之间的差别,使得将它们作为一个整体来评估网络性能的过程变得困难。算法的价值无处不在,它涵盖了各种形式的计算机系统、存储设备、网络连接以及软件工具。然而,目前,学者们仍然无法为这些各种形式的资源提供有效的规范;第三,各种应用场景下,对算法的要求也各有千秋。

(6)算力路由技术

路由层是算力网络的核心之一,主要作用是支持网络系统的正常运行并提供计算服务,也可以用于数据信息的存储,需要根据用户的实际使用需求制定算力的调度策略。随着技术的发展,传统的路由计算方式已经不能满足日益复杂的业务需求,导致资源的有效利用率受到影响。因此,行业内提出了计算优先网络,以降低链路开销,并且通过增加算力和度量方法,如现场可编程门阵列、带宽等,来提升系统的性能。

三、算力网络技术方案

(1)算力网络功能架构

以算力网络需求为基础,在编排管理层的协调下,算力网络控制层收集资源信息,并将其可编程化,以实现资源的有效利用,从而建立起完整的网络连接。此外,各层之间也要进行有效的协作,以满足用户不同的服务需求,实现资源的最佳利用。

IMG_256

图1、算力网络功能架构图

在算力网络服务层,我们提供了多种服务,包括用户、平台和资源节点之间的交互,以满足不同的需求。

在计算机系统中,控制层负责收集和传输数据,然后转换为可执行的模式。当这些模式被执行完毕,它们就会被存储起来。随着模式的继续执行,它们可能会创造出新的模式,使得它们能够与现有的模式相互协作,实现对系统的最优化。通过使用各种方法,我们可以在计算机视觉中构建一个复杂的系统,它可以根据用户的要求来管理和监测数据。该系统的四个主要部件可以支持各种操作,分别为:存储、数据传输和信息发现。利用先进的技术和架构,我们可以将东部的接口和编码管理系统相连,从而更好地执行和完善运营者的运行和维护策略。我们可以根据客户的具体情况来监测和分析业务的需求,以及算法的性能,从而灵活地设计和优化算法配置。

通过"linkstate",转发层对/算力需求进行了动态分析,并将其与SRv6源的路由相关联,以便更好地满足用户的需求。IOAM的应用则使得/算力的变化得到了及时的反馈,从而使得/算力的变化也被及时地检测,从而有效地改善了用户的体验。

计算能力的基础架构之一就是资源分配。这一结构涵盖了许多不同类型的计算设备,例如云计算设备和边缘计算设备,以及其他各种安装和维护设备。

通过使用算力网络编排和管理层,我们可以实现多种功能,包括但不限于:编排、安全性、建模、OAM等。

负责算力网络资源和服务的编排和管理;

通过使用安全相关的控件,我们可以有效地降低算力网络环境中的安全风险;

可以根据服务类型进行算力建模;

通过实施有效的算力网络管理,我们能够有效地运行和维护。

算力网络交易平台由三个部分组成:消费者、供应商和管理人员。这些部门负责为用户提供交易服务和管理功能。

(2)CFN路由协议

CFN协议是一种有助于改善系统性能的技术,它可以有效地连接客户的数据,并且可以根据当前的计算技术、网络环境等因素,向各个计算节点传递指令,从而使得系统的性能达到极致,同时也改善了客户的使用体验,大大提高了系统的效率。

在Underlay网络技术上面构造出CFN算力路由层,完成算力路由标志、监控、状态路由报告、寻址、表项创建等功用。CFN能够为数据分配最优化算力,达到数字与算力最优化联接,利用网络协议划分计算节点的算力信息,整合算力信息和网络资源,为数据提供最优化的算力分配及联网,将数字灵活调度到最优化的算力结点上,达到数字与计算资源相互之间的有效、优质联接。分布式的算力作为算力网络系统中的内生来源,通过DynCast拉通联接成网,实现边缘计算高可靠性、系统整体利用效率最优。

(3)AI推动算力从云逐步下沉到端

AI技术发展迅速,推理与训练分开部署加速算力资源下沉,对网络更加依赖。端侧AI带来算力需求,随着端之间互动增多,多位置之间算力需要网络协同。异构计算将无处不在,网络可以提供更高的协同效率。

(4)5G实现端-边-云算力持续性服务

伴随5G发展,车联网、IOT等新业务陆续成熟,对算力本地化、应用响应时延提出更高要求,需要业务无中断。5GToB市场加速边缘DC/MEC部署,“漫游”用户需要边缘算力提供持续服务。C-V2X需要更多可持续算力开展业务创新。

(5)计算能力

单核算力将持续提升,如骁龙865算力达15T,但芯片工艺到3nm后将越来越难加工;多核算力随着核数与频率提升将面临更复杂的芯片架构设计与功耗控制;提供算力的芯片类型层出不穷,异构计算需求将逐步增多;算力提供方越来越多,算力资源使用效率参差不齐且存在峰谷效应。在计算芯片领域,国产化芯片较领先产品差距较大,但通过算力网络联接更多计算服务,通过架构创新可减小技术差距带来的算力缺口,形成云-边-端多级算力协同供给体系,可以支撑实现更多需求侧业务体验提升,同时促进计算资源使用效率普遍提升,加速算力基础设施发展与建设。

四、基于算力网络和算网融合技术典型场景

(1)工业互联网场景

传统工业制造的应用、数据限定在工厂内网中,随着工业互联网的发展,更多的业务需要内外网协同、公私算力协同、中心边缘算力协同的支撑。以机器视觉质检为例,机器视觉纪要在工业现场进行推理,也需分析采集的数据进行持续模型训练,实现自学习。受强实时性要求的限制,推理一般由部署在工厂内的边缘算力完成。模型训练对实时性要求不高,可部署在公有算力上节省成本。典型部署架构图如下图2:

IMG_256

图2、典型部署架构图

(2)云虚拟现实场景

虚拟现实(VR,virtualreality)对算力资源的要求高,传统本地VR需购置本地算力,成本较高,制约了VR的发展。云虚拟现实(CloudVR)因其庞大的算力资源和灵活的计费策略,成为应对VR挑战的解决思路。然而,CloudVR对网络的超低时延提出了更高要求。基于确定性网络打造的算力网络,可提供多算力协同时的实时数据互通、算力资源与本地VR显示终端之间的低时延网络传输保障。确定性算力网络可根据CloudVR的算力需求、网络需求,进行算力资源和网络资源的预留和调度,保障算力侧的处理时延、网络侧的传输时延降到最低。

(3)车联网场景

车联网进入"算力网络"时代之后,汽车将获得更好的支撑,应用和生态有了更多的想象空间。面对车联网剧增的算力,算力网络具有相对较多的优势。通过部署边缘算力,我们能够更好地支持实时业务,例如对摄像头、传感器等设备进行数据采集和分析,对汽车状态信息进行实时监测,对道路情况进行实时反馈,并对汽车进行实时控制。对时延要求不高的业务,可交由中心算力完成,例如道路拥堵信息、车辆统计信息、周边施工信息等。通过确定性网络的保障、中心和边缘算力的分工协同,既对车联网提供了有效支撑,又充分利用了算力资源,避免算力资源浪费。

五、结语

总而言之,随着信息技术的飞速发展,算力网络也得到了巨大的改变,从传统的通用算力转变为多样化的异构算力,从单点的局限性转变为泛在的持续性,从而促进了网络与计算的深度融合。算网融合是指以网络为核心,整合各种算力资源,采用智能化的调度和编排管理,实现高效的算力利用,从而重塑信息通信网络和计算模式。随着计算网络深度融合的不断发展,我们需要采用全新的架构、协议和接口,以实现算网的一体化,并且不断推动算网融合的实现。

参考文献:

[1]莫益军.算力网络场景需求及算网融合调度机制探讨[J].信息通信技术,2022(02):16.

[2]唐国强.基于配网的5G通信承载网资源分配近优算法探讨[J].学生电脑,2021(11):100.

[3]曹畅,唐雄燕.算力网络关键技术及发展挑战分析[J].信息通信技术与政策,2021,47(3):6-11.

[4]李少鹤,李泰新,周旭.算力网络:以网络为中心的融合资源供给[J].中兴通讯技术,2021,27(3):29-34.

[5]陈寒冰.数字经济时代算力网络建构的国际比较与镜鉴[J].新疆社会科学(汉文版),2021(5):56-65.

[6]雷波.整合多方资源算力网络有望实现计算资源利用率最优[J].通信世界,2020(8):39-40.

[7]蒋林涛.云计算、边缘计算和算力网络[J].信息通信技术,2020,14(4):4-8.