算力网络是一种具备在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源能力的新型网络基础设施 [10] 。其中,边缘计算作为其组成部分,将计算能力下沉到网络边缘,提高了实时性和效率。两者的结合为应用提供了更灵活、更强大的信息网络基础设施,共同满足从低算力需求的简单物联网应用到高算力需求的大型人工智能应用。
在数字化时代,计算资源,即算力,已经成为一项至关重要的基础资源。各种计算密集型业务(如人工智能等)不断涌现,对计算资源需求巨大。在云计算解决方案中,通常采用建设集中化的超级计算池来满足这些需求。
然而,在许多新兴业务场景中,集中式计算并非解决所有问题的唯一途径。受业务特性、成本、网络条件等多种因素驱使,集中式计算难以满足应用需求,例如会有时延、功耗等多种约束因素,相反,需要在多个分散的算力节点之间进行选择,这意味着用户需要能够随时获得分布式的算力资源。因此,在数据生成和计算需求不断增长的人工智能时代,算力将逐渐从云中心分散到网络内和网络的边缘,以满足数据和计算资源之间的即时需求,分布式计算代表着未来云计算和网络技术的重要演进趋势。
边缘计算的实施需要通过有效的通信实现资源的互联,因此资源可达性成为首先要考虑的问题。随着5G、SDN、NFV等技术的不断发展,通信网络得以按需连接资源池与用户,极大地提高了连接速度和质量,克服了阻碍资源可达性的瓶颈。
5G时代的到来使更多地区可以享受不受限制的高速网络接入,其高速和低时延特性彻底改变了互联网的应用方式。从更快的下载速度到实时高清视频通话,5G为各种应用提供了无缝运行的可能性,不仅提升了娱乐体验,还为远程办公、远程医疗和智能城市等领域创造了全新的机遇。5G的引入为边缘计算提供了强有力的支持,显著降低了终端与边缘之间的数据传输时延,使得实时决策和处理成为切实可行的选择。
SDN技术的进步使得在用户和算力池之间建立灵活弹性的连接变得更加迅速高效。用户的数据通过SDN技术可以以快速、高效、安全的方式传送到特定资源池,完成用户服务后,连接可以迅速拆除,从而减轻网络负担,进一步降低用户成本。这一发展为边缘计算的实施提供了更为可靠的基础。
NFV技术支持使用通用化的硬件构建统一的资源池,这样不仅可以大幅降低硬件成本,还可以实现网络资源的动态按需分配,从而实现资源共享和资源利用率的显著提升。在基于NFV架构的网络中,业务部署只需申请云化资源加载软件即可,网络部署和业务创新变得更加简单。
前面的分析表明,边缘计算业务正在迅猛发展,这需要广泛分布的计算资源,这些资源可能分布在不同的地点。然而,关键在于如何通过网络有效地协调和整合这些分散的资源,以便用户可以根据其业务需求自由选择适当的计算资源。因此,资源整合和协同成为一个新兴的挑战。
我们需要进一步研究云服务提供商是否有能力有效整合这些资源。如前所述,云服务提供商依靠规模效应来降低成本,特别是在人力成本方面,他们希望实现数据中心的自动化运维,减少人工干预。然而,如果他们要大规模地与各个机房的所有者进行洽谈、签署合同,并承担后期设备的管理和维护,这将需要大量人力资源。在当前市场状况下,云服务提供商更愿意与拥有大量资源的企业合作来共同运营。换句话说,云服务提供商面临着一个重要问题,即如何有效地协调和整合边缘计算所需的分散资源。他们更愿意与资源丰富的合作伙伴合作,而不是承担大规模的独立运营和管理工作。
中小型算力资源的所有者也面临着很大的经营难题。这是因为他们通常拥有有限的技术能力,难以开展广泛的业务,能够提供的产品和服务也相对有限。特别是在用户提出新需求时,他们难以迅速提供有效的技术支持。此外,企业由于规模较小,市场推广的力度有限,很难将自身的资源信息传达给潜在客户。
算力网络的兴起标志着数字时代中一种新型的计算力资源共享模式的出现。这一概念源于计算业务对计算能力日益增长的需求。算力网络的本质是通过互联网连接各种计算设备,形成一个分布式的算力网络,允许用户在需要时访问这些计算资源 [10] 。个人用户、企业和研究机构可以通过算力网络灵活地获取和提供计算资源,无须依赖传统的集中式云计算服务。这种新兴的模式不仅降低了计算成本,还促进了更广泛的计算资源共享,推动了科学研究、数据分析和人工智能等领域的创新发展。
算力网络是一种通过网络分发服务节点的计算能力、存储、算法等资源信息,并结合网络特性(如带宽、时延等),根据不同类型用户的需求,提供最佳的资源分配和网络连接方案的新型信息基础设施,可实现整个网络中资源的最优化利用。
从资源分配的角度看,算力网络与云网协同都可以做到将算力资源信息与网络资源信息匹配,以实现多类资源的联合优化。但云网协同和算力网络两者在本质上有很大的差异。
云网协同,有时也称为云网融合或云网一体化,其核心概念是以云计算为中心,网络连接根据云服务的特性来进行调整,这被描述为“网随云动”。这一战略的主要实施方式包括以下两种。
1)云管系统的资源调度。网络资源的能力被开放给云管系统,这个系统负责协调管理计算资源、存储资源和网络资源等。这种方法的核心思想是云服务的需求决定了网络的配置和性能。
2)网络控制单元的调度。云管系统将网络需求发送给专门网络控制单元,如网络协同编排器。这个网络控制单元根据云业务的需求来调整和协调网络资源,确保网络满足云服务的要求。
要注意,这种方法的关键是首先选择云服务,然后根据所选服务的特性来确定适当的网络连接。这意味着一个云服务提供商可以连接到多个不同的网络,甚至可以利用SDN、网络功能虚拟化等技术来实现不同网络运营商的跨域连接。这种方法的目标是最大限度地提高云服务的性能和可用性,通过灵活的网络配置来满足不同云业务的需求。
算力网络是以另一种方式解决计算资源分配问题的方法。在这种网络中,算力池会将其闲置的计算资源信息发送给网络控制面,然后通过网络控制面(可以是集中式控制器或分布式路由协议)来分发这些计算资源信息。当系统接收到用户的业务需求时,它可以通过分析路由表中记录的网络信息和计算资源信息,来选择最适合的算力池和网络路径。
如图1-3所示,基于算力网络架构中各模块功能的分类,以及各模块之间的关系,算力网络按功能层次划分,大致可分为服务提供层、服务编排层、网络控制层、算力管理层、算力资源层和网络转发层。
图1-3 算力网络架构
服务提供层是用户与平台之间的接口,它实现了用户服务开发功能。用户可以通过服务提供层调用平台的原子功能和服务,如负载分担和人工智能算法等。服务提供层通过北向接口与用户的业务服务连接,允许用户在自己的应用中定义业务服务。对于需要的功能和算法,用户将其委托给服务提供层来执行。服务提供层会处理这些任务并返回结果。用户对服务提供层功能的管理通常通过服务编排层间接实现,但直接调用原子功能则通过与服务提供层的接口实现。同时,服务提供层从网络控制层获取算力资源和网络资源信息,以支持信息处理,并在返回结果给用户的同时,将处理后的中间数据和其他必要信息提供给网络控制层使用。
服务编排层充当了整个算力网络的中央控制器的角色。它负责监控、管理、调度、分配和全生命周期管理虚拟机、容器、网络等各种服务资源。服务编排层通过与不同层级的接口协同,下发编排和调度指令,并获取相关信息,最后将这些信息传递给用户。这一层的功能可以被类比为算力网络的“大脑”协调各种资源以满足用户需求。
网络控制层在算力网络中具有重要作用。它通过网络控制平面实现对算力信息资源的关联、分发、寻址、调配和优化等功能。这一层既负责收集和分发底层资源信息,又提供网络服务给上层使用。此外,当服务编排层需要与网络控制层进行信息交互时,网络控制层能够提供最新的网络状态信息和全局算力信息,起到连接上下层的桥梁作用。简而言之,网络控制层是整个算力网络的关键组成部分,协调和优化资源分配以满足用户需求。
算力管理层是关键的资源管理层,主要负责注册、建模和支持不同类型的异构算力资源,如中央处理单元(Central Processing Unit,CPU)、图形处理单元(Graphics Processing Unit,GPU)、神经网络处理单元(Neural Processing Unit,NPU)等。CPU用于通用计算,GPU专注于图像处理,而NPU则用于加速神经网络相关计算等。这些不同类型的算力资源需要在算力管理层进行注册,然后由网络控制层发布到网络上。
此外,算力管理层还扮演了合理调度不同类型处理器资源的角色,确保它们能够最有效地执行适合它们的任务。这涉及统一建模,并与网络控制层的调度相结合,以确保异构算力资源能够充分发挥各自的优势,为上层提供最佳的计算支持。
算力资源层和网络转发层在算力网络中以一体化方式合并设置,需要根据实际情况和应用需求,结合计算处理能力和网络转发能力,实现各类计算和存储资源的高质量传输和流动。
算力资源层的职责是维护各种异构算力资源,包括CPU、GPU、NPU等主要用于计算的处理器,也包括带有存储能力的各种独立存储或分布式存储,以及通过操作系统逻辑化的各种数据处理设备。从设备的角度来看,算力资源层包括常见的数据中心计算设备,同时还考虑未来智能互联设备,如汽车、手持终端、无人机等,它们都能提供算力支持。
网络转发层则属于SDN架构的数据平面,它负责部署各种网络设备,并根据网络控制层下发的转发表项来引导数据包的转发。这两个层面的融合协同,确保了计算资源和网络资源之间的协调运作,以实现高效的数据传输和处理。
在算力网络的架构中,边缘计算被巧妙地融入整体系统,形成高效的分布式计算生态。该网络包括云数据中心、边缘节点和可能的物联网设备。架构的核心思想是将计算资源尽可能地推向离数据源更近的地方,以提高系统的整体性能和响应速度。
在算力网络的设计中,边缘节点的选择和配置起着至关重要的作用,直接影响整个系统的性能和效率。首先,硬件规格是选择边缘节点时的关键考虑因素之一。不同的应用场景和任务类型需要不同的计算资源。处理器性能、内存大小、存储容量和网络带宽都需要根据实际需求进行精心平衡。例如,对于计算密集型任务,需要选择性能较高的硬件以确保任务的迅速完成,对于数据密集型任务,更大的存储容量和高带宽的网络可能更为关键。
在考虑边缘节点的选择时,任务类型是一个需要仔细考虑的因素。不同节点可能更适合处理不同类型的任务。合理的任务分配可以优化整个系统的性能。此外,能源效率也是一个不可忽视的因素,特别是在移动边缘设备或物联网设备中,对能源的高效利用是必不可少的。
在考虑边缘节点在算力网络中的部署时,地理位置是一个关键的考虑因素。选择离用户或数据源更近的位置有助于降低数据传输的时延,提高系统的响应速度。地理分布的节点可以有效构建鲁棒性更强、更可靠的系统,以适应不同地区的需求。边缘节点被布置在关键地理位置,可能是城市中心、工业园区或其他关键场所。这些节点可以是强大的服务器、边缘计算设备或嵌入式系统,根据任务和性能要求的不同而灵活配置。边缘节点之间通过高速网络连接,来实现实时数据交换和协同计算。
了解算力网络的未来趋势对技术、商业和社会都具有重要意义,因为它们将深刻地塑造我们的未来,影响各个领域的发展和演进。
首先,算力网络是现代科技的关键驱动力之一。随着计算能力的不断增长,我们能够解决更加复杂的问题,加速科学研究,推动技术创新。了解算力网络的未来趋势有助于我们预测计算能力的发展方向,从而更好地规划研究和开发项目,提高技术的效率和性能。
其次,算力网络的未来趋势对商业世界至关重要。云计算、边缘计算、分布式计算等技术的发展将改变商业模式和市场竞争格局。了解未来的计算趋势可以帮助企业更好地适应和利用这些变化,提供更好的产品和服务,拓展市场份额,增加竞争力。
最重要的是,算力网络的未来趋势对社会有着深远的影响。它们将影响教育、医疗、交通、工业等各个领域。例如,边缘计算可以改善医疗诊断和远程手术的精度和效率,智能交通系统可以减少交通拥堵和事故,提高出行的安全性。了解未来的计算趋势有助于社会更好地规划基础设施和公共政策,提高生活质量和社会福祉。
我国的主要电信公司,如中国移动、中国电信和中国联通,都已制定了与边缘计算、5G承载和云网融合相关的战略规划。例如,中国联通在2019年公布的《中国联通算力网络白皮书》中指出,基于国家战略以及对5G和人工智能发展的预测,中日韩这三个制造业大国,都面临着人口老龄化的挑战,这必将推动产业升级,实现信息化向智能化的转变。因此,这三个国家也将是全球最早研究和实践“算力网络”的地区。中国电信的《中国电信云网运营自智白皮书》聚焦于边缘计算的智能应用。白皮书提到,算力网络将与人工智能、大数据分析等技术相结合,实现更高效的数据处理和决策。中国电信认为,算力网络在医疗保健、智慧城市、农业等领域有着广阔的商业前景,可以提供个性化的解决方案。中国移动的《中国移动算力网络白皮书》则更加关注边缘计算的安全性和可靠性,强调了在物联网时代,边缘设备需要更强大的安全性保障,以防止数据泄露和网络攻击。中国移动计划通过构建边缘安全网络,提供全方位的安全服务,为各行业提供信任和保障。
在算力网络时代,我国已经通过5G和人工智能的结合,开始在各行各业实现智能化。近年来,我国研究机构已经开始协同合作,积极向全球推广算力网络的需求、场景和生态,初步掌握了算力网络研究的主导权。
在2021世界计算大会上,中国信息通信研究院发布了《中国算力发展指数白皮书》。白皮书建立了算力发展研究框架和指标体系,从算力规模、算力环境和算力应用 3 个维度建立算力发展研究体系,给出了算力的研究范畴、总体框架和测算方法,研究了全球及我国算力发展的态势,系统测算了全球及我国的算力规模,以及算力对经济的带动作用,客观评估了我国各省市现阶段的算力发展水平,对各地推动算力技术产业、基础设施建设及算力应用的发展具有较强的指导作用。
2021年3月,中国联通推出了新一代数字化基础设施CUBE-Net 3.0,强调中国联通作为电信运营商,致力于成为数字基础设施新网络的构建者、算网一体确定性新服务的创造者、智能端云产业新生态的合作者,以更好地推动经济社会产业升级,助力各行各业的数字化转型和智能化改造。
中国移动同样在布局算力网络创新技术研究。2021年以网强算,提出“算力网络”全新理念:以算为中心、以网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合,实现算力泛在、算网共生、智能编排一体服务。2023年,中国移动在技术架构上,提出“大-广-融”的技术架构规划,推动云网协同向云网融合方向发展;在资源投入上,累计投产云服务器超71万台,净增超23万台,不断优化“4+N+31+X”集约化梯次布局,已实现100%省份覆盖。在赋能行业上,目前移动云聚焦政务、医疗、教育等重点行业场景,助力超百万政企客户数字化转型升级,为数字中国构筑强大“云底座”,真正做到“为国建云”。
在社会变革方面,算力网络的出现将对社会和文化产生深远影响。首先,算力网络将推动社会向更加智能化的方向发展,提高社会运行效率。其次,算力网络将促进社会公平,让更多人享受到数字化带来的便利。最后,算力网络将推动文化的变革,新的文化产品和服务将不断涌现,丰富人们的精神生活。
然而随着算力网络的不断发展,其对社会和政策的影响也日益显现。在法规和监管方面,算力网络的复杂性和去中心化特性给传统的监管方式带来了挑战。因此,有必要出台新的法规来监管算力网络,确保其合法合规运行。例如,可以制定算力网络的数据安全法规,保护用户隐私和数据安全;制定算力网络的运行规范,防止恶意竞争和市场操纵;制定算力网络的税收政策,确保公平公正。此外,在软硬件选型方面,算力网络具有碎片化和异构性的特点,会有各类不同的计算框架。这就要求既要对自身应用的计算特性做深入了解,从而找到计算能力满足应用需求的硬件产品,又要找到合适的软件框架进行开发,同时还要考虑硬件的功耗成本在可接受的范围内。因此设计用于性能、功耗和成本分析的边缘计算平台是一项复杂的任务,需要深入了解应用需求、硬件设备、软件框架以及与之相关的资源管理和优化策略。
综上所述,算力网络的发展带来了机遇和挑战。在抓住机遇的同时,我们也应看到潜在的风险,通过制定合适的法规和政策,引导算力网络的健康发展,实现社会和文化的共同进步。随着ICT的不断发展,算力网络将会不断完善,在不远的将来必定会成为数字化信息社会的重要服务基石。