购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3 总体框架

1.3.1 简述和示例

图1.2描述了一个由四层组成的通用城市计算框架。以城市异常检测为例 [36] ,我们首先简要概述框架,然后在1.3.2节中分别介绍每一层的功能。

在城市感知中,我们不断使用GPS传感器或手机信号来探测人们的流动性(例如,城市道路网络中的路线行为),还不断从互联网上收集人们(在这个城市)发布在社交媒体上的帖子。在城市数据管理中,人类流动数据和社交媒体由一些索引结构组织,这些索引结构同时包含时空信息和文本,以支持高效的数据分析。在数据分析中,一旦出现异常,我们就能够根据人类流动数据,确定人们的流动性与其初始模式有显著差异的位置。然后,我们可以通过从社交媒体中挖掘与这些位置以及检测到异常的时间跨度有关的代表性术语来描述异常。在所提供服务中,异常的位置和描述将被发送给附近的司机,以便他们可以选择绕行。该信息被传递给交通主管部门,用于分散交通拥堵并诊断异常情况。系统循环执行上述四个步骤,实时检测城市异常,改善人们的驾驶体验,减少交通拥堵。

与其他通常基于单(模态)数据、单任务框架的信息系统(如语言翻译或图像识别引擎)相比,城市计算拥有多(模态)数据、多任务框架。城市计算的任务包括改善城市规划、缓解交通拥堵、节约能源、减少空气污染等。此外,我们通常需要在单个任务中利用大量数据集。例如,上述异常检测要使用人群流动数据、道路网络和社交媒体。通过将不同来源的数据与框架不同层的不同数据采集、管理和分析技术相结合,可以完成不同的任务。

图1.2 城市计算的总体框架

1.3.2 各层功能

本节讨论城市计算框架中每一层的功能和关键组件。

1.3.2.1 城市感知和数据采集层

城市感知通过传感器或城市中的人收集不同来源的数据。城市感知主要有两种模式,分别是以传感器为中心的感知和以人为中心的感知。前一种模式将传感器集合部署在固定位置(如气象站),如图1.3a所示,也称为静态感知;或将传感器与移动物体(如公交车或出租车)一起部署,如图1.3b所示,也称为移动感知。一旦部署好,这些传感器就不断地将数据发送到后端系统,而不需要人员参与。

图1.3 城市感知的不同模式

以人为中心的感知模式利用人类作为传感器,当人类在城市中移动时探测城市动态。然后,综合个人收集的信息去解决问题。这种感知模式可以进一步分为两类:被动人群感知和主动人群感知。

当个人用户使用现有的城市基础设施,如无线通信系统和公共交通系统时, 被动人群感知 程序被动地收集他们的数据,如图1.3c所示。人们甚至不知道他们在为被动人群感知程序贡献数据。例如,虽然无线蜂窝网络是为个人之间的移动通信而构建的,但一大群人的手机信号可以帮助我们了解全市通勤模式,从而改善城市规划 [5] 。同样,乘客在地铁站的刷入和刷出数据也可以描述人们在城市中的通勤模式,尽管这样的票务系统最初是为收取人们的通行费用而创建的。通勤者在通过自动检票口时根本不知道自己在执行感应任务。

主动人群感知 可以被视为众包 [18] 和参与式感知 [4] 的结合。这种感知模式如图1.3d所示,人们主动从周围获取信息,并贡献自己的数据以便综合起来解决问题。人们清楚地知道分享的目的以及他们在参与式感知项目中所做的贡献。他们还可以根据可用性和提供的激励措施来控制何时何地参与此类感知项目。当参与者众多且预算有限时,主动人群感知项目还涉及参与者招募和任务分配过程 [6,14]

1.3.2.2 城市数据管理层

城市数据管理层使用云计算平台、索引结构和检索算法管理来自不同领域的大规模动态城市数据,如交通、气象、人员流动和POI数据。

第一,该层为不同类型的城市数据在云上设计了不同的存储机制。根据数据结构,城市数据分为两类:点数据和网络数据。城市数据也可以按其时空动力学分为三类,包括时空静态数据、空间静态时间动态数据、时空动态数据。

第二,该层为空间和时空数据设计了独特的索引结构和检索算法,因为大多数城市数据都与空间和时间属性相关。此外,为了支持上层的跨域数据挖掘任务,需要混合索引结构来组织来自不同域的多模态数据。这些索引和检索技术是上层数据挖掘和机器学习任务的基础。

第三,该层还启用了一些高级数据管理功能,包括地图匹配 [31,56] 、轨迹压缩 [7,42] 、寻找最大 k 覆盖 [27] 和动态调度 [32-33,62] 等,这些功能本身就可以解决许多城市计算问题。

1.3.2.3 城市数据分析层

该层应用了多种数据挖掘模型和机器学习算法,以发挥不同领域数据中知识的能量。该层采用基本的数据挖掘和机器学习模型,如聚类、分类、回归和异常检测算法,来处理时空数据。该层还基于跨域数据融合方法 [64] 融合了来自多个不同数据集的知识,如基于深度学习 [61] 、基于多视图、基于概率相关性和基于迁移学习 [48] 。由于许多城市计算应用程序需要即时服务,因此在数据挖掘中将数据库技术与机器学习算法相结合也很重要。基于上述组件,该层的高级主题包括填补时空数据中的缺失值、预测模型、对象分析和因果推断。还必须启用交互式视觉数据分析 [28] ,通过让领域专家参与数据挖掘循环,将人类智慧与机器智能相结合。

1.3.2.4 服务层

服务层提供了一个接口,允许领域系统通过云计算平台从城市计算应用中获取知识。由于城市计算是一个跨学科的领域,数据中的知识必须整合到现有的领域系统中,以指导系统的决策制定。如图1.4所示,通过一组应用程序编程接口(API),城市计算应用程序中的空气质量预测可以整合到现有的移动应用程序中,帮助人们做旅行规划或者帮助环境保护机构制定污染控制决策。

图1.4 城市计算服务

就服务创建的时间而言,这一层提供了三种类型的服务,包括理解当前情况、预测未来和诊断历史。例如,基于大数据推断整个城市的实时和细粒度空气质量属于第一类 [71] ,预测未来空气质量属于第二类 [77] ,根据长期积累的数据诊断空气污染的根本原因属于第三类 [80] 。基于创建服务的领域,该层提供从交通到环境保护、城市规划、节能、社会功能和娱乐以及公共安全领域的服务。 mR7gVEPF7PaYRmnMWSCiFTNfGrAMJ0sPfqgVss0vvixNuCpS6i98WeSWu9TvfliC

点击中间区域
呼出菜单
上一章
目录
下一章
×