算力网络:以网络为中心的融合资源供给

2021-11-28 00:59李少鹤李泰新周旭
中兴通讯技术 2021年3期

李少鹤 李泰新 周旭

摘要:算力网络能够改善边缘和云中心、边缘和边缘的资源互通调度问题,实现算力、存储、网络等多种资源动态调度,并提供极致的服务质量。基于网络计算模型的发展历程和算力网络需求背景,提出算力网络的供给模式和3层服务模式,指出算力网络是一种以网络为中心的多种融合资源供给网络计算模型。

关键词:算力网络;以网络为中心;网络计算模型;供给模式

Abstract: Computing power network can improve resource interoperability and scheduling in edge-to-cloud and edge-to-edge scenarios, realize the dynamic scheduling of multiple resources such as computing power, storage, and network, and provide ultimate service quality. Based on the analysis of development process of network computing model and the background of computing power network demand, the supply paradigm and three-layer service mode of computing power network are proposed. It is pointed out that computing power network is a network-centric new network computing model with integrated supply of multiple resources.

Keywords: computing power network; network-centric; network computing model; supply paradigm

随着5G网络时代的到来,以及人工智能、大数据技术的兴起,作为互联网基础设施的计算机网络体系面临巨大的挑战。国际数据公司(IDC)预测,2020—2025年将有超过50%的数据会在网络侧进行存储、计算和处理[1]。在中国“新基建”战略的指引下,“新联接”和“新计算”成为建设数字基础设施的重要抓手。当前,计算能力供需关系不平衡成为产业创新升级演进的瓶颈。构建弹性开放、高效协同的计算基础设施,成为信息技术(IT)产业与通信技术(CT)产业融合发展的重要共识。

算力网络采用以网络为中心的多种融合资源供给网络计算模型,依靠“云数据中心+边缘服务器+用户终端”三级协同(简称“云+边+端”协同),使计算资源从终端、云向边缘扩散,以便提供泛在网络连接和算力服务,实现算力资源的灵活调度。算力网络有望满足智能社会中新型业务对网络的需求,实现“算力无处不在、随取随用”的未来网络场景。

1 网络计算模型发展历程

網络和计算一直以来是计算机领域发展的主线。在两者互补融合的历程中,网络计算模型的变化经历了多个阶段。图1展示了计算网络模型及其使能技术演化和网络计算场景需求变迁的脉络。

在早期的大型计算机时代,用户终端仅仅作为显示器,并通过通信线路连接到大型主机,使用集中点的算力资源。那时的计算资源完全集中,网络只起到终端登录连接的作用,功能单一。

随着个人计算机(PC)的发展,主机间的通信需求促进计算机网络的蓬勃发展。同时,随着PC的普及,计算资源也变得越来越分散。在20世纪90年代,随着计算资源的分散化和计算机网络的发展,研究者提出一种分布式的网络计算模型——网格计算,即利用大量异构的计算机闲置中央处理器(CPU)计算资源和磁盘存储资源,通过网络通信技术,将其作为一个分布式的大规模计算机集群,以完成需要大量算力的计算任务[2]。网格计算技术的愿景十分宏大。然而,由于这一技术思想过于超前,当时的PC和网络性能均不能支撑大规模分布式网络计算的场景。此外,在商业模式上,闲置资源的利用效率不高。这使得网格计算并没有获得大规模商用,多被用于志愿科学计算。网格计算的提出,为后来网络计算模型的发展提供了思路和技术基础。

随着互联网业务的飞速发展,人们对计算存储能力的需求不断攀升。在2006年提出的云计算便是脱颖于网格计算思想的下一代网络计算模型[3]。通过分布式技术,云计算将计算、存储资源存放在云网络中心,使用户仅通过网络就可以获得庞大的计算资源和存储服务。相对于网格计算完全分散的计算资源,云计算的计算、存储资源仍是集中部署的。这使得云计算可以完成高可靠且高弹性的资源供给。这与以WEB为代表的互联网服务对资源的需求高度吻合,因此云计算一提出便掀起热潮。云计算衍生出多种云服务模式,是一个里程碑式的网络计算模型。云计算诞生于固定互联网业务需求之下,为移动互联网的发展奠定坚实的基础,并与智能手机这一新型终端一起,掀起移动互联网发展的浪潮。目前,几乎所有通用互联网、移动互联网应用都被部署在云服务器中。可以说,云计算贯穿了整个通用互联网和移动互联网的发展,成为互联网经济的核心推动力。

近年来,互联网技术开始从消费类应用场景向产业应用场景拓展。物联终端、工业设备、智能汽车等更多类型的终端开始联入网络。产业应用的新业务对实时性、可靠性、吞吐能力、能耗等的要求远远高于消费类的应用,网络环境也变得更加复杂。面向产业应用的特殊需求,传统云计算数据中心部署位置距离用户较远,无法为时延敏感业务提供低时延服务。把海量物联终端数据传输到云计算中心进行处理,将给网络带来巨大的带宽压力。单单依靠集中式的云计算,无法有效支撑产业互联网的发展。在这种需求的推动下,边缘计算应运而生。边缘计算将数据存储、处理和计算下沉到网络边缘,并接近用户终端,可以满足低时延、大带宽、低能耗的网络需求。边缘计算这一概念最早由2009年的Cloudlets演化而来[4],并作为5G网络的使能技术,伴随着5G技术进入快速发展期。2014年欧洲电信标准协会(ETSI)提出移动边缘计算。随后,移动边缘计算演化为多接入边缘计算[5]。边缘计算模型使得算力资源在网络中得到进一步丰富,地理布局更广,提供方式更为灵活,弥补了云计算集中部署带来的时延、带宽方面的弱点,是新一代网络计算模型从“集中”回归“分布”的又一次轮回。

按照时间顺序,表1给出了网络计算模型发展历程中的关键技术和思想对比。从前文描述可以看出,一项技术的成功,除了技术本身的先进性以外,真实存在的产业需求、可行的商业模式都是决定性的因素。

2 算力网络需求背景

2.1 算力网络发展背景

在5G人工智能(AI)时代,新型网络业务持续涌现,对算力的需求飞速增长。高算力和低时延的应用场景愈加多样化,如物联网、智慧出行、虚拟现实、泛在计算等。这些场景对算力的需求亦呈现多样化爆发式增长。随着万物互联愿景的进一步推进,联网终端和设备数量将呈现指数级增长。据Statista预测,2025年全球物联网设备将超过750亿台[6]。用户对于时延、带宽的变化更为敏感,对服务质量的要求进一步提高。

与此同时,算力资源的供给也将进入快速发展期。2020年4月20日,中国国家发展和改革委员会首次明确新型基础设施建设(简称“新基建”)的范围。其中,信息基础设施包括以数据中心、智能计算中心为代表的算力基础设施等。这是“算力基础设施”这一概念首次在国家层面的被提出。目前,多种算力供给设施正在大力建设中,如超算中心、云计算数据中心、智能计算中心、边缘计算站点。有报告指出,与已投运机柜数相比,2020年北京、上海、广州、深圳周边的在建和规划数据中心机柜增长超过了300%,这说明算力资源供给进入快速增长期[7]。相比于2020年,2025年以边缘计算为代表的分布式算力资源将增长790%,超过集中式算力资源。IDC预计,未来中心化算力占比将不超过12%,分布式算力将超过88%[7]。

随着算力需求和算力供给的飞速增长,算力供需之间的不平衡问题愈加凸显。IDC数据表明,计算资源的综合利用率普遍小于15%。特别是边缘计算节点,由于均是面向特定场景建设的,计算负载的潮汐效应往往更加明显,单靠目标应用场景,难以消耗边缘计算节点的所有算力资源。目前,云计算中心和边缘计算节点之间、边缘节点和边缘节点之间的计算资源调度不够灵活,集中式算力资源和分布式算力资源发展不一致,导致算力供给与需求无法有效匹配,使局部过载而其他资源闲置的情况出现。这大大降低了算力资源作为信息社会底层基础设施能力的效率。由于现有网络系统存在局限性,业务大多属于静态部署,资源复用率低。网络配置也多为静态,路由寻址方式效率低,难以针对目前轻量级的微服务需求进行优化。算力资源需要与网络结合,更大范围、更细粒度地有效匹配和调度,才能充分发挥海量算力的真正效用。

2.2 算力资源和网络能力适配

算力在“集中-分布”模型间呈现钟摆式变化。随着边缘计算的兴起和智能社会的算力需求发展,算力即将进入“集中+分布”的全新发展阶段。

集中式算力资源可以高效处理需要大算力的计算任务。分布式算力资源可以为终端用户提供高质量、低时延、随用随取的算力服务。面对“云+边+端”网络协同和“集中+分布”算力协同的场景需求,以及为解决算力资源供给失衡的问题,网络在新型网络计算模型中将会占据更重要的位置。网络的功能将从“连接算力”(为数据中心、算力节点和用户终端提供连接功能)转向“调度算力”(通过网络对算力节点间的算力资源分配和调度),甚至转向“组织算力”(对整个网络中的异构算力资源进行编排和组织管理)。新需求对网络能力的要求进一步提高,即要求网络可以容纳、调度、编排多种地理布局、多种物理异构,并提供海量的计算、存储、连接资源。新型网络计算模型将会以网络为中心,实现算力资源和网络能力的有效适配,最大限度地提供高效的网络算力调度和编排。

3算力网络供给模式与核心特征

3.1 网络计算资源的组织与供给模式

在目前的网络生产关系下,产业链各方不同程度地掌握了应用需求、计算资源、网络资源。与之对应,网络计算资源的组织与供给可能有以下3种模式,如表2所示。

(1)以应用为中心。在这种模式下,算力资源的组织与调度以自身的业务生态为中心。具有代表性的算力服务商有百度、阿里、腾讯等大型OTT(指互联网公司越过运营商)互联网企业。它们在进行算力资源的部署时,以自建为主、整合第三方算力资源为辅,并基于OTT模式,租用运营商网络资源实现传输与调度。以应用为中心的模式本质上是云计算模式的扩展。对于互联网公司来说,这种模式具有业务延续性好、技术成熟、成本相对较低的优点。然而,由于不同互联网业务生态系统之间存在互斥,这种模式的算力网络服务较难保证第三方的公立性。同时,由于采用OTT模式,不直接掌控网络资源,该模式难以支持高可靠、低时延业务。

(2)以计算为中心。在这种模式下,算力资源主要来自原分散的第三方算力,通过服务网络加以组织,来执行计算任务。此模式以新兴的区块链算力网络公司为代表,例如BHP、EXODUS、Computing Planet等[8]。它們的算力资源多为整合的第三方算力资源,自建算力资源比例较低。基于OTT模式,它们租用运营商网络资源来构建overlay的算力网络,在应用层实现传输与调度。然而,以计算为中心的模式也存在一些问题:难以保证服务质量,支持的业务类型较为有限,管理成本相对较高。

(3)以网络为中心。这种模式强调直接使用底层网络对算力进行整合、组织和调度,通过优化后的算力标识、路由协议与传输协议,来实现算力资源与网络资源的高度集成与协同调度。具有代表性的算力服务商为网络运营商,其算力资源部署以自建为主、第三方为辅,且拥有大量的边缘计算节点,同时算力资源分布广泛、类型丰富。这种模式具有完整的底层网络资源和调度管理能力,可以按照应用需求来按需调度合适的算力资源,并保证网络传输质量。以网络为中心的模式具有明显优点:算力服务的中立性最高,服务质量可保证,管理成本较低。

从以上分析可以看出,以网络为中心的算力组织与供给模式最符合未来多元化业务发展需求,也最符合算力作为智能社会底层基础设施的定位。

3.2 算力网络核心特征:以网络为中心的融合资源供给

算力网络是以网络为中心的新型网络计算模型。基于最新网络技术,如运用网络功能虚拟化技术(NFV),算力网络可以有效地将异构算力资源虚拟化。此外,通过云网融合技术和软件定义网络技术(SDN),算力网络还可以将网络中的计算、存储、连接资源进行智能化的有效编排,将计算资源、存储资源等多维异构资源完全融入到网络系统中,使各类资源节点在网络中可以通信和实时交互,并进行多维异构资源的动态调度。算力網络的出现是资源供给模式的变革,它通过网络来连通分散且碎片化的计算、存储等资源,构建一体化的信息通信技术(ICT)基础设施,并向各相关产业提供网络、计算及存储等服务,如图2所示。

在算力网络中,与算力任务相关的算力网络能力,比如算力资源、服务标识,在网络边缘进行收集,并向用户提供算力网络能力视图。用户通过应用,发出初始报文携带算力任务的需求,比如需要的算力种类、算力总量、服务名字、时延上限、任务拆分等。基于收集到的算力网络能力详情和相应的需求到能力的映射算法,算力网络边缘网关将用户的算力任务需求组合,映射为相应的算力网络能力组合。然后基于预设语法,将算力网络能力组合解析为相应灵活的报文格式。这些报文携带调用相应算力网络能力的指令和元数据,以便完成算力任务。

在算力网络服务模式下,用户无须在海量、分散的算力供应商中选择合适的算力点,也不必担心网络能力如何与计算模型相匹配。算力网络将帮助用户发现性能最佳的算力资源,按照业务需求来规划可靠的网络路径与传输服务,并帮助用户高效率地完成业务,使成本降到最低。

4算力网络服务模式

算力网络吸纳和调度各类分布式的算力,以统一服务的方式,并结合确定性网络输送高可靠、可度量、通用化的算力资源,来使能人工智能应用,体现网络价值。运营商或者第三方公司建设供给侧的算力供给资源池,并通过算力网络完成基础设施供给、网络连接供给和平台及业务能力供给,以满足需求侧的虚拟现实、云渲染、自动驾驶以及AI等应用的算力需求。

算力网络服务形态决定了算力调度方式、度量方式、盈利模式和商业模式。类比于云计算的基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)的3层服务模式,算力网络也可以自底向上分为3种服务形态,如图3所示。

(1)算力基础设施服务形态。算力服务商提供基础算力设施,算力资源以算力站点结合虚拟网络的形态存在。需求侧租赁算力网络服务商提供的算力资源,并由算力网络调度用户请求并使之到达合适的算力部署站点,同时由用户决定算力设施的使用方式。这种服务形态主要面向那些拥有较强IT开发能力、产品对算力依赖强、有能力对算力进行精细化管理的客户,如大型互联网公司、独角兽企业、云计算中心。

(2)算力平台服务形态。算力服务商提供算力平台和开发环境,算力资源以算力资源池的形态存在。用户无须关注算力资源部署细节,即可基于算力平台来开发和使用高质量、低时延的算力。这种服务形态主要面向那些具备一定IT开发能力、产品对算力较依赖的客户,如大型工业制造企业、中小互联网企业。

(3)算力软件服务形态。算力服务商提供上层算力应用服务,算力资源以应用程序接口(API)的形态存在。用户无须关注系统和软件细节,仅提交业务需求,并通过API完成算力任务。这种服务形态主要面向那些IT开发能力弱、产品对算力较依赖、无法对算力进行精细化管理的客户,如互联网小微企业、物联网公司、制造业企业等。

算力网络服务形态亦是算力网络研究者的重点研究方向。算力网络将打破传统运营商仅贩卖网络连接和流量的盈利模式,有助于扩展算力需求的商业客户。3层算力网络服务形态模型具有自下而上垂直拓展的特点,针对不同的算力业务需求,可以提供全方位和高自由度的实现方式,能够给予算力网络供应商更多可能的服务方式和业务模式。

5 算力网络发展现状

算力网络架构一提出便备受业界关注,业界对于算力网络的研究正在如火如荼地开展中。华为提出算力网络基础框架计算优先网络(CFN)。三大运营商也在着力建设算力网络架构设施,并发布对算力网络的研究成果[9-12]。为满足未来科学研究范式向基于大数据发展的需求,中科院计算机网络信息中心提出面向科研大数据的算力网络架构。

算力网络的标准化和产业化也在持续发展中。2019年末,华为和移动基于CFN技术提出3项国际互联网工程任务组(IETF)标准草案。目前,这3项标准仍在持续更新中[9, 13-14]。2019年10月,在国际电信联盟(ITU)全会上,中国移动提出算力感知网络(CAN)相关草案,华为、中国联通和中国电信也提出算力网络(CPN)的相关草案[15-16]。同时,华为在宽带论坛(BBF)上也进行城域算力网络(MCN)的立项[17]。目前,华为和运营商在ETSI和中国通信标准化协会(CCSA)也在积极推进算力网络相关标准的立项工作。

在产业动态方面,网络5.0产业和技术创新联盟也在积极参与算力网络的生态建设。联盟成员包括华为、三大运营商、中科院计算机网络信息中心、中国信息通信研究院、清华大学等。该联盟成立“算力网络特设工作组”,将5G智能云化网络架构推进为算力网络[18]。目前,华为、中国移动、中国电信均已完成算力网络的初步试验部署,并展示了试验验证成果。此外,中国联通也在开展算力网络服务平台的试点工作。

6 结束语

如同电力的普及奠定了工业社会发展的基础一样,泛在算力将成为智能社会发展的基石。在政策上,算力网络是中国新基建概念中算力基础设施建设的核心之一,它响应了建设数字化、智能化社会的政策号召;在技术上,算力网络符合5G+AI技术建设乃至6G网络建设的要求,并可以起到关键作用;在商业应用上,算力网络将为各行各业提供高质量、低时延、大带宽的网络、计算、存储服务,符合未来网络业态的良性发展趋势。

参考文献

[1] REINSEL D, GANTZ J, RYDNING J. Data age 2025: the evolution of data to life-critical [R]. 2017

[2] LAN F, CARL K. The grid: blueprint for a new computing infrastructure [M]. San Fransisco: Morgan Kaufmann publisher, 1999

[3] AZODOLMOLKY S, WIEDER P, YAHYAPOUR R. Cloud computing networking: challenges and opportunities for innovations [J]. IEEE communications magazine, 2013, 51(7): 54-62. DOI:10.1109/MCOM.2013.6553678

[4] SATYANARAYANAN M, BAHL P, CACERES R, et al. The case for VM-based cloudlets in mobile computing [J]. IEEE pervasive computing, 2009, 8(4): 14-23. DOI:10.1109/ MPRV.2009.82

[5] ETSI. Multi-access edge computing (MEC) framework and reference architecture: ETSI GS MEC 003-2019 [S]. 2019

[6] Statista Research Department. Internet of Things - number of connected devices worldwide 2015-2025 [R]. 2019

[7] 前瞻產业研究院. 2021-2026年中国IDC(互联网数据中心)行业市场前瞻与投资战略规划分析报告 [R]. 2020

[8] BHP工作组. BHP全球智能算力网络项目周报[R/OL]. [2021-03-18]. https://m.huoxing24. com/userCenter/4c1079cbe18d4e57a7722a2fd676763a

[9] LI Y, HE J, GENG L, et al. Framework of compute first networking (CFN) [Z]. 2019

[10] 中国移动研究院, 华为技术有限公司. 算力感知网络白皮书 [R]. 2019

[11] 中国联合网络通信有限公司. 中国联通算力网络白皮书 [R]. 2020

[12] 雷波, 刘增义, 王旭亮, 等. 基于云、网、边融合的边缘计算新方案: 算力网络 [J]. 电信科学, 2019, 35(9): 44-51

[13] GU S, ZHUANG G, YAO H. A report on compute first networking (CFN) field trial [Z]. 2019

[14] GENG L, WILLIS P. Compute first networking(CFN) scenarios and requirements [Z]. 2019

[15] GENG L, LEI B, FU Y, et al. Use cases and requirements of computing-aware networking for future networks including IMT-2020: ITU-T 480-WP1 [S]. 2019

[16] HUAWEI Technologies Co. Ltd, China Telecom. Framework and architecture of computing power network: ITU-T 563-WP3 [S]. 2019

[17] HUAWEI Technologies Co. Ltd. Metro Computing Network (MCN) [EB/OL]. [2021-03- 18]. https://wiki.broadband-forum.org/display/ BBF/SDN+and+NFV

[18] 网络5.0产业联盟. 网络5.0产业联盟CFN特设组倡议与筹备汇报 [Z]. 2019

作者简介

李少鹤,中国科学院计算机网络信息中心在读硕士研究生;主要研究方向为新型网络技术、网络流量感知和预测等。

李泰新,中国科学院计算机网络信息中心助理研究员;主要研究方向为网络协议、机器学习、天地一体化网络等;发表论文20余篇,申请专利10余项。

周旭,中国科学院计算机网络信息中心研究员;主要研究方向为未来网络架构、5G/B5G、天地一体化网络、人工智能、边缘计算等;发表论文70余篇,申请专利40余项。