购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.1 引言

感知、计算和通信技术的进步为在大都市区域收集广泛的数据提供了前所未有的机会。城市感知作为城市计算的基础,通过从传感器和人那里收集全市数据来探测城市的脉搏和节奏。然后,在城市计算框架的上层对数据进行管理和分析。尽管城市感知的概念在2008年的文献 [7-8,29] 中已有讨论,但城市科学和计算技术经过演变产生了新的功能和意义,丰富了城市感知的内涵和扩展。本节介绍每种城市感知范式,展示其代表性应用,并讨论其关键挑战和技术。

3.1.1 城市感知的四种范式

城市感知主要有两种范式,包括以传感器为中心的感知和以人为中心的感知,如图3.1所示。前一种范式进一步包括两个子类别:静态感知和移动感知。后一种范式包括两个子类别:被动人群感知和主动人群感知。

图3.1 四种城市感知范式

3.1.1.1 以静态传感器为中心的感知

这种感知范式在固定位置(例如,在气象监测站)部署了一系列静态传感器,如图3.1a所示。一旦传感器部署完成,其位置就不会随时间改变。这些传感器以一定的频率(例如,每小时一次)自动向后端系统发送数据。每个传感器可以分别发送数据,也可以先与邻居形成一个传感器网络,然后通过网络中的某些网关集体上传数据。目前城市中部署的大多数感知系统,例如用于感知交通状况的交通循环检测器和用于感知空气污染物浓度的空气质量站,都属于这一类别。这样的城市感知范式面临两个主要挑战。

第一个挑战是由于资源限制,如预算、土地利用和劳动力等因素,我们可以在城市中部署的传感器数量通常非常有限,这导致数据覆盖稀疏,给全市监控和进一步的数据分析带来了挑战。例如,尽管我们希望监测全市的交通状况,但由于各种限制,我们通常只能在一些主要道路上部署交通循环检测器。由于交通流量在不同地点显著且非线性地变化,因此没有循环检测器的道路上的交通状况不能仅根据其他有传感器的道路进行线性插值。

第二个挑战是如何选择合适的地点部署传感器。一个方法是在传感器部署之前测量一个地点的质量,例如,为了最大限度地提高整个城市的空气质量监测能力,应该在哪些地方部署四个额外的空气质量监测站。不幸的是,在部署监测站之前,我们不知道一个地点的空气质量的真实情况。此外,通常有许多候选地点,这导致从中做选择的高计算复杂度。例如,选择三个道路交叉口部署加油站,以便这些加油站覆盖尽可能多的车辆,这相当于一个子模最大化问题,它是NP困难的。

3.1.1.2 以移动传感器为中心的感知

这种范式在移动物体上部署传感器,如在自行车、公交车、出租车、无人机和卫星上,如图3.1b所示。传感器的位置随着移动物体的移动而改变,不断地在不同位置收集和发送数据到后端系统。一旦部署了这些传感器,人们就不再主动参与感知循环。例如,我们可以在许多公交车上部署传感器来探测城市的空气质量。无线通信模块每过十分钟自动将收集的空气质量数据发送到后端系统(例如,云计算平台)。传感器和通信模块所需的电源可以由公交车的电池提供。假设有相同数量的传感器随着传感器在城市中移动,这种范式收集的数据覆盖范围应该比使用静态感知更大。此外,与静态范式相比,在以移动传感器为中心的范式中部署传感器更加灵活和具有非侵入性。

这种感知范式也面临其自身的挑战。由于城市中移动物体的运动高度倾斜,这种感知范式可能导致数据分布不平衡。在很少有移动物体经过的地方,收集到的数据非常稀疏。在大量移动物体经过的其他地方,则可能会收集到冗余的数据。正如硬币有两面,虽然这种感知范式减少了人力投入,但失去了对可以收集哪些数据的控制。

3.1.1.3 被动人群感知

这种感知范式收集的是人们在被动使用城市基础设施时生成的大量数据,如图3.1c所示的无线通信系统和公共交通系统。在这种感知计划中,人们甚至不知道他们在贡献数据,更不用说系统的目的了。例如,虽然无线蜂窝网络是为了个人之间的移动通信而建立的,但大量的手机信号可以帮助理解全市的通勤模式,从而改善城市规划。同样,地铁站或公交车站乘客的刷卡数据可以描述城市中人们的通勤模式,尽管这样的票务系统最初是为了收取人们的行程费用而创建的。当人们通过自动检票闸机时,他们甚至不知道自己在执行感知任务。其他例子包括自行车共享系统中的检入/检出记录以及乘客的出租车费用数据。这种感知范式面临的挑战是城市基础设施的规模限制了感知任务的地理范围。如何在利用人们的数据的同时保护他们的隐私是一个重大关切点。

3.1.1.4 主动人群感知

这种感知范式是人群感知 [24] 和参与式感知 [6] 的结合。如图3.1d所示,它通常由一个感知项目所有者和一组参与者组成。项目所有者定义一个感知任务并提供预算以完成任务。任务可能包括要收集的数据类型、地理区域、预计收集此类数据的时段,以及激励机制以鼓励人们贡献数据。人们可以根据相关可用性和感知项目提供的激励措施来决定何时何地加入感知项目。在参与感知项目时,人们积极收集周围的信息并贡献自己的数据,形成可以解决问题的知识集。人们明确知道收集任务的目的以及他们为参与式感知项目贡献了什么。

在有许多参与者和预算有限的情况下,主动人群感知项目将涉及参与者招募和任务设计过程。前一个过程根据参与者的历史表现和他们所能收集的数据对整个感知项目的潜在贡献来选择优质参与者。后一个过程可以根据地理位置和时间,为特定参与者定制任务(例如,在哪里以及何时收集某种类型的数据)。

主动感知范式面临的挑战有四个方面。第一,城市中人口的分布(和移动性)本质上是不均匀的,导致数据覆盖不平衡。虽然在一些地方接收到的数据是冗余的,但在其他地方可能缺乏数据。第二,衡量已经收集到数据的质量(涉及平衡性和数量)是困难的。显然,相对于数据充足的地方,在数据缺乏的地点收集到的数据应该更有价值。第三,我们不想招募那些会贡献噪声或虚假数据,或者不能履行承诺的参与者。然而,评估参与者的表现并不容易,因为在大多数情况下,我们想要收集的数据没有基准真实值。第四,任务设计过程通常非常消耗计算资源,意味着有时它是一个NP困难问题。

为了在主动人群感知项目中推进参与式感知,Campbell [7-8] 和Lane等人 [32] 提出了机会感知的概念,其中在参与者的设备(例如,手机)状态(例如,地理位置或身体位置)与应用程序的要求相匹配时会自动利用该设备。为了保持透明度,设备的机会使用不应明显影响参与者的正常使用体验,因为它用于满足参与者自身的需求 [7-8] 。根据Campbell的说法,机会感知的主要挑战在于确定感知设备的状态何时与应用程序的要求相匹配,以及在设备状态与参与者的要求相匹配时进行采样 [8]

3.1.2 城市感知的一般框架

图3.2展示了城市感知的一般框架,它由五个层次组成。

图3.2 城市感知的一般框架

3.1.2.1 第一层

第一层包括四个定义感知程序的元素:地点、执行感知程序的时间间隔、程序的预算,以及一个具体任务(例如感知城市噪声或交通状况)。这四个元素在程序开始前由感知程序的所有者定义。

3.1.2.2 第二层

第二层的目的是部署传感器或为人员分配任务,以便他们为感知计划收集数据。在以传感器为中心的感知程序中,传感器部署过程是在第一层给出的预算限制下,在适当的位置或一些移动物体上安装传感器。这一过程旨在通过一些部署模型,根据不同的测量结果优化感知结果。3.3节将介绍四种类型的模型。

在主动人群感知中,我们首先需要根据一些测量结果选择一些高质量的参与者。有时会利用任务设计流程,根据参与者的偏好或限制条件为特定参与者定制任务。例如,Ji等人 [29] 设计了一个由一系列地点(和访问时间间隔)组成的任务,根据参与者的出发地、目的地、出发时间和到达时间,为特定参与者感知城市噪声。由于被动感知计划利用的是已为其他目的建立的现有基础设施,因此无须选择参与者、设计任务或部署传感器。

3.1.2.3 第三层

第三层通过不同的途径从传感器或参与者那里收集数据。通常,在一个静态的以传感器为中心的感知程序中,每个传感器可以分别发送数据,或者首先与邻居形成一个传感器网络,然后通过网络中的网关集体上传数据。关于移动的以传感器为中心的感知,每个传感器通常分别发送数据,因为移动对象可能会单独且随机地移动。最常用于主动人群感知程序的设备是手机,每部手机都配备了相当多的传感器(如三维加速计、陀螺仪、麦克风、相机、GPS设备)和通信模块(如GSM、Wi-Fi、蓝牙和NFC)。然后,收集到的数据流会传输到云计算平台。

3.1.2.4 质量评估

在数据收集之后,我们需要评估其质量。对于一个以传感器为中心的感知程序,数据评估过程可以帮助确定是否需要部署额外的传感器以及传感器应该放置的位置。例如,我们在北京部署了36个空气质量监测站。这些站点收集的数据在监测整个城市的空气质量方面效果如何?这是一个非常具有挑战性的任务,因为在站点部署之前,我们不知道某个地方的空气质量的真实情况。Zheng等人 [53] 通过机器学习推理方法解决了这个问题。基本思想是基于现有站点的数据训练一个推理模型,并用该模型推断没有站点的位置的空气质量。如果一个位置空气质量推理的置信度非常高,那么在那里部署站点并非必要,应将推理不确定性最大的前 k 个位置视为部署站点的地点。基于这个想法,Hsieh等人 [25] 在有新的预算可用时建议了部署额外站点的位置。

对于主动人群感知程序,一个好的数据评估指标可以帮助确定是否需要招募更多的参与者,甚至可以在主动人群感知程序真正开始之前帮助选择参与者。例如,Ji等人 [29] 提出了一个基于层次熵的指标来评估已经收集或计划收集的数据的质量,同时考虑数据的平衡性和数量。这个指标随后被用来选择那些能够收集数据以显著改善该指标的候选参与者。

3.1.2.5 数据预处理

在感知程序结束后,我们需要进行一些数据预处理,比如填补缺失值和过滤噪声数据。由于通信或设备错误,我们可能会丢失一些传感器在某些时间间隔的数据。这给实时监控和进一步的数据分析带来了挑战。为了解决这个问题,Yi等人 [51] 提出了一种通过多视角学习方法集体填补地理感官数据中缺失值的方法,该方法考虑了同一系列中不同时间戳读取之间的时间相关性以及不同时间系列之间的空间相关性。 vWEMLfdnYnCjjrlQgFBlQW48FD6Ju8sOhWY2iYbtkztzklMpZO1WvBbVwJaJLnVb

点击中间区域
呼出菜单
上一章
目录
下一章
×