购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 云边端融合计算模式

智能信息处理的基础在于计算,而终端设备固有的载重、能耗、价格等限制导致其无法完成高性能的计算任务,成为在终端设备上进行智能信息处理的瓶颈问题。智能模型学习训练通常要依托高性能计算集群,远远超出单台终端设备的算力条件。仅考虑智能模型的部署运行,一个复杂的智能模型需要进行大量浮点运算,这对终端设备的算力与续航力提出了严苛的要求。通过一种高效的信息处理框架,拓展终端设备的算力,为终端设备提供高效的计算服务,是实现终端智能信息处理的基础性问题。

1.2.1 云边端融合计算模式的发展

纵观计算模式的发展,呈现出集中式和分布式轮回变化的态势 [7] 。云计算自2006年首次被提出以来,成为信息技术产业发展的战略重点。通过将大规模计算资源集中起来,按需、灵活地提供计算服务,云计算在各行各业得到大规模应用。近年来,随着终端设备的普及,催生了终端信息处理的需求。受限于终端设备有限的性能,学术界与工业界尝试将终端设备与云计算中心相结合,根据终端设备性能、应用场景和用户要求等条件,在线、动态地在云中心和终端之间分配计算和数据,实现云中心和终端上各类计算资源、数据资源、应用资源乃至用户资源的按需配给。将云计算的中心模式拓展为云与终端相融合的模式日益得到广泛关注 [8]

然而,云计算中心通常远离终端设备,云与终端的直接融合不可避免地面临着高延时、低效率等问题。随着通信技术的跨代发展,一种在网络边缘执行计算的新型计算范式——边缘计算,应运而生。相较云计算技术,边缘计算以近终端、低延时、更高效的优势,构建了离数据源更近的计算基础设施 [9] 。边缘计算最早可以追溯到内容分发网络中功能缓存的概念 [10] 。2009年,卡内基梅隆大学提出微云(Cloudlet)的概念 [11] ,在网络边缘部署可信的服务器,将云服务器的功能下沉到边缘,具备了边缘计算的部分雏形。随后,在万物互联的背景下,边缘计算得到快速发展,并逐渐在核心概念上达成共识:边缘是指从数据源到云计算中心路径之间的任意计算和网络资源,计算对象包括来自云服务的下行数据和来自万物互联服务的上行数据 [12] 。至此,云边端三层计算模式基本成型。

云边端融合计算模式为拓展终端设备算力、优化终端设备计算服务能力提供了一种可行框架。终端设备在进行职能信息处理的过程中,需要执行类别、要求不同的各类智能计算任务,根据不同任务类型与应用场景条件,可以选择不同的云边端协同计算服务模式。例如,复杂智能模型的学习训练任务,计算量极其庞大,需要依托高性能计算集群长时间进行运算,可以将它们配置在云计算中心执行。再如,智能模型的精调任务,算力要求大大降低,可配置在边缘设备或协同多台终端设备执行,减少数据在云计算中心与其他设备之间的传输。因此,系统可基于云边端融合计算服务框架,针对智能信息处理任务的特征、设备资源状况与网络环境状况,在终端设备、边缘设备、云计算中心或协同多设备灵活配置、优化计算服务,为终端智能服务提供稳定、高效的基础计算服务支撑。

1.2.2 云边端融合的终端智能信息处理框架

我们认为,围绕终端智能信息处理的现实需求,采用云边端融合计算模式为终端设备提供基本计算服务是一种可行的解决方案。我们提出一种云边端融合的终端智能信息处理框架,如图1.1所示。

img

图1.1 云边端融合的终端智能信息处理框架

该框架主要包括应用业务层、终端设备层、微云/边缘层、云中心层4个主要部分。其中,云中心层主要包含各大型云中心,它们通常具有最强的计算、存储能力,计算与存储的单位成本低廉,但通常与信息处理业务发生地距离较远,对带宽有着较高的要求。微云/边缘层的边缘计算设施在距业务发生较近的位置,可为各终端系统提供计算、存储服务。微云/边缘层计算设施能够有效缓解向云中心层请求服务带来的带宽压力,降低数据传输成本,并提高响应速率,但它们的资源与云中心层设施资源相比通常是有限的。应用业务层和终端设备层直接面向用户。终端设备层根据应用业务的不同调用不同的智能信息处理服务,在考虑应用业务特征的基础上,可进一步综合使用微云/边缘层、云中心层设施资源为各智能信息处理提供有效的计算保障。

在智能计算的学习训练阶段,通常依赖云中心层强大的计算、存储能力进行大型智能模型的训练,而后将训练好的智能模型下发至边缘节点和终端设备。在微云/边缘层和终端设备层,可利用距离信息处理业务发生地较近的优势,利用信息处理过程中实时产生的数据进行智能模型的精调训练,使云中心层训练得到的智能模型更适合终端智能信息处理业务需求,这些精调训练任务可在微云/边缘层完成,也可利用联邦学习 [13] 等新兴方法,由终端设备层、微云/边缘层协同完成。在智能计算的部署运行阶段,智能模型通常被部署到距离信息处理业务发生地最近的终端设备上,直接面向用户提供服务。然而,先进智能模型日趋复杂,运行阶段对计算性能的要求提高,超出了终端设备的算力与能耗限制。此时,终端设备可根据业务需求,将部分智能计算任务包括模型、数据等卸载至云中心或边缘设备中,终端设备仅进行简单计算,甚至仅用于反馈计算结果,以大幅度降低终端设备本地的算力开销,此种计算任务卸载是云端协同智能信息处理的主要形式之一。

上述智能信息处理业务在云边端三层的协同依赖于三层间的数据传输。终端设备可根据信息处理任务的算力要求、时效要求,由本地单独处理或卸载至友邻终端设备、边缘设备或云中心协同处理。当计算任务算力要求较低时,计算任务可由终端设备本地处理,以最小化延时。当计算任务算力要求较高时,如智能模型训练、复杂模型运行,可根据通信条件,选择近距离传输至友邻终端设备处理或卸载至微云/边缘层处理。当计算任务算力要求很高且与云中心链路通畅时,甚至可将计算任务直接传输至云中心处理,以降低本地负担。

1.2.3 云边端融合计算模式面临的挑战

我们认为,围绕终端智能信息处理的现实需求,采用云边端融合计算模式为终端设备提供基本计算服务是一种可行的解决方案。同时,由于终端设备区别于其他设备平台的鲜明特征,使得实现高效终端智能信息处理颇具挑战,从数据传输优化到数据隐私安全,再到模型高效部署与模型持续优化,整个周期上均面临若干瓶颈性挑战,直接影响终端智能信息处理的实际应用效果。

1. 数据传输优化问题

在大量终端设备、边缘设备和云计算中心之上建立一个整体融合的信息处理框架的基础在于终端-边缘-云三层之间能实现高效的数据传输。终端设备上有大量数据和计算任务需要上传至边缘设备或云中心进行处理;云中心和边缘设备同样有大量数据和计算模型需要下发至各终端设备。考虑终端设备规模的庞大性及无线通信网络的复杂性,实现终端-边缘-云三层之间高效的数据传输是一个颇具挑战性的问题。首先,中心节点对大规模终端设备集中优化的方式需要频繁交互和大规模计算,无法满足抢险救灾、战场等环境下抗单点失效的要求,需要采用分布式协同方法优化终端数据传输。其次,在无线网络环境下终端设备往往难以及时共享各自的状态信息和传输需求,这大大增加了分布式协同优化的难度。最后,无线网络环境的不确定性导致优化条件高度动态且难以预测,无法通过离线优化方法精确求解,需要动态、实时的优化方法。

2. 数据隐私安全问题

在学习训练阶段,以深度学习为例,一个性能卓越的智能模型通常需要使用大量数据来训练,其中可能包含涉及用户隐私的敏感数据,甚至可能包含法律禁止公开的数据。已有大量研究表明,在获得智能模型后,可通过生成对抗网络等方法从模型中反推得到训练数据的信息。然而,终端智能信息处理的特点决定了智能模型会随终端设备在公开环境下广泛部署,包括恶意用户在内,所有用户均可接触智能模型,这使训练数据的隐私安全难以保证。在部署运行阶段,终端设备在卸载过程中会将相关计算数据从终端设备传输至云中心或边缘设备中,这在复杂的通信环境下,会给终端设备数据和系统安全带来严重的隐患。传统的数据加密方法虽然可以保护数据安全,但是会引入大量额外的计算开销,增加计算任务所需时间,占用终端设备更多的算力,难以保持计算任务卸载降低计算负担的初衷。

3. 模型高效部署问题

在智能模型的部署运行阶段,模型推理计算对终端设备的算力和续航力提出了严苛的要求,这在算力能耗受限、价格敏感的终端设备上往往难以被满足。正如上文所说,计算任务卸载是云边端融合计算模式下实现高效部署智能模型的途径之一。需研究模型分割方法,实现将复杂推断等大负载计算任务均卸载至云中心执行的目标。然而,计算任务卸载的方式依赖终端设备与云中心或边缘设备之间网络的通畅,在终端设备所处的无线网络环境中,并不能随时确保传输链路连通,也不能保证终端用户具有卸载计算任务和数据的意愿,当无法向云中心或边缘设备传输数据时,终端设备仅能依靠自身算力完成计算任务。针对此挑战,需研究智能模型压缩方法,在可接受的性能折损范围内,显著压缩智能模型大小,降低模型存储要求和计算要求,满足在终端设备上独立部署运行的性能要求。

4. 模型持续优化问题

终端设备广泛部署的特点决定它所面对的场景和用户复杂多样,导致终端智能信息处理需求也存在一定差异。但是,当前人工智能技术的发展水平远未实现普适、通用智能,在部署云侧集中训练得到的模型后,往往难以满足具体应用场景下用户的个性化需求,这将严重影响终端智能信息处理的用户体验,制约终端智能信息处理的广泛应用。在云边端融合计算模式下,可以在更靠近用户和应用的终端侧、边缘侧,利用终端设备系统运行过程中产生的新的、面向应用的数据,对智能模型进行持续、个性化改进升级,提升模型在特定应用场景下的性能。综合减轻上行链路负担和保护用户隐私等考虑,上述过程通常应在边缘侧和终端侧进行,在边缘环境下,数据分布不均衡、终端设备算力受限、无线网络状态不稳定,如何解决这些问题,实现有效的面向应用的持续学习训练是提升终端智能信息处理质量的关键。 qklTR5fdE7Cg+eSRuvPAHgyE7MA24e/lKCjKNvPZvRgyZR6UGUMRs99V3u+pxR0h

点击中间区域
呼出菜单
上一章
目录
下一章
×