随着社会的发展和科技水平的不断提高,物理世界的联网需求与信息世界的扩展需求催生出一种新型的网络——物联网(Internet of Things,IoT) [1] 。物联网是一种基于互联网、传统电信网等信息载体,让所有能够被独立寻址的普通物理对象实现互联互通的网络 [1] 。它具有普通对象设备化、自治终端互联化以及普适服务智能化 3 个主要特征,能用于智能家居、智能物流、智能交通、军事领域以及环境检测等方面 [2] 。物联网能够实现万物相连、万物相通,近年来受到国内外学术界和工业界的广泛关注和研究。2009 年 8 月,时任国务院总理的温家宝视察无锡的物联网中心时,提出了“感知中国”的构想,并指出我国将大力发展物联网技术。同样,美国IBM首席执行官彭明盛在 2009 年 1 月举行的美国工商业领袖会议中,提出与物联网类似的概念,即“智慧地球(Smart Earth)”。时任美国总统的奥巴马对此给予高度评价,并将它作为 21 世纪美国互联网发展的重点。
物联网主要包含 4 层,即感知识别层、网络构建层、管理服务层和综合应用层 [2] 。其中,作为连接物理世界和信息世界的桥梁和纽带,感知识别层是物联网的核心 [2] 。传统的感知网络主要包括有线静态传感器网络和无线传感器网络(Wireless Sensor Networks,WSN)。有线静态传感器网络是最传统、最简单的感知网络。例如,在城市交通视频监控网络中,各个静态部署的传感器将感知的数据通过地面部署的有线网络传输到中心服务器。这种传感器网络的缺点是部署成本高,部署后很难重新调整。无线传感器网络利用大量低成本、低功耗的传感器,通过无线通信的方式形成多跳自组织网络,可以有效地克服有线静态传感器网络成本高、动态调整性差的缺点。无线传感器网络被广泛用于军事、救灾、环境、医疗以及工业等领域。但是,无线传感器网络需要为了某个特定的应用任务在某个特定的区域进行专门部署和维护,在物联网的大规模、细粒度、全面透彻的感知中,部署和维护成本非常高。例如,清华大学在无锡利用无线传感器网络建立和部署了城市环境监控网络系统CitySee [3] 。这个系统只部署了一个覆盖单个社区的 2 000 个传感器节点的网络,就耗费了 2 000 多万元。如果利用无线传感器网络部署覆盖一座城市、一个国家甚至全世界的感知网络,它的部署和维护成本将难以想象。
随着无线通信和传感器技术的发展,以及无线移动终端设备的爆炸式普及,普通用户使用的移动设备(如智能手机和平板电脑等)集成了越来越多的传感器,拥有越来越强大的计算和感知能力 [4] 。利用众多普通用户现有移动设备中的传感器进行感知,通过已部署的移动互联网(如蜂窝网和Wi-Fi等)进行数据传输,形成了一种新兴的感知网络,即群智感知网络(Crowd-Sensing Networks) [5-6] 。群智感知网络利用现有的感知设备和已部署的通信网络,无须专门的部署和维护,大幅度地降低了成本。同时,手机等移动设备使用的普适性以及用户的自然移动性,群智感知网络能够以非常低的成本实现大规模和细粒度的感知。群智感知网络能够很好地解决当前大规模感知网络成本高这个关键难题,近年来受到学术界和工业界的广泛讨论和研究 [6-8] 。
群智感知网络是近几年出现的一个新兴研究领域,其研究还处在一个初级阶段。要将它实现和大规模应用还有很多问题需要解决 [6-7] ,其中关键的问题是数据感知质量管理。群智感知网络利用用户现有的感知设备和已部署的网络,大量未经训练的用户和不准确的感知设备导致感知数据不准确、不可靠、不完整、不一致和不及时等问题,很难直接应用于各种感知应用中。对感知数据进行质量管理,便于感知应用的使用,是实现群智感知网络的关键。数据感知质量管理技术的研究对群智感知网络的实现以及物联网的进一步发展具有重要意义。
随着微电子技术、计算机技术以及无线通信技术的高速发展,使制造低成本、低耗能且具有感知、处理和通信能力的传感器成为可能 [2,9] 。传感器作为信息获取的一种重要方式,与通信技术和计算机技术共同构成信息领域的三大支柱。近年来,基于大量传感器构成的无线传感器网络被提出,并被广泛用于军事、救灾、环境、医疗和工业等领域 [10] 。无线传感器网络是指“ 由大量低成本 和低功耗 , 具有感知 、 计算和通信能力的传感器通过无线通信的方式形成的一 个多跳自组织网络 ” [10] 。
无线传感器网络一般由多个传感器节点(Sensor)和汇聚节点(Sink)组成。传感器节点通过无线通信,以自组织网的方式,将感知数据传送到汇聚节点。汇聚节点再将感知数据通过与它相连的外部网络(如互联网等)传送出去。无线传感器网络具有成本低、网络自组织、动态调整性强以及便于部署等优点。目前,国内外已有很多实际部署的大型无线传感器网络用于各个领域的信息感知。例如,美国弗吉尼亚大学(University of Virginia)开发和部署了无线传感器网络系统VigilNet [11] ,用于军事领域中的敌人监视和跟踪。美国加利福尼亚大学伯克利分校(University of California,Berkeley)部署的Trio系统 [12] ,利用无线传感器网络对目标进行监控和跟踪。香港科技大学和中国海洋大学联合开发的OceanSense系统 [13] ,在山东省青岛市的黄海上部署了基于无线传感器网络的海洋环境监控系统。香港科技大学和浙江农林大学合作开发的GreenOrbs系统,在浙江省临安市天目山国家级自然保护区中部署了基于无线传感器网络的森林环境监控系统 [14] 。清华大学在江苏省无锡市部署了CitySee系统 [3] ,利用无线传感器网络来监控城市的环境,如二氧化碳、温湿度以及其他空气污染物。
物联网发展到今天,对透彻全面感知的需求越来越强烈。已发展了十几年的专门部署的无线传感器网络进入一个新的发展方向,即利用现有的感知设备和已有的通信网络形成的群智感知网络。它和无线传感器网络共同构成了物联网当前两种重要的感知网络。
本节将详细地介绍当前群智感知网络的研究和发展。首先介绍其定义和起源,其次给出其架构和特点,最后将它与传统无线传感器网络进行比较。
1 )群智感知网络的定义和起源
群智感知网络(Crowd- Sensing Networks)是一种利用广大普通用户现有的、集成大量传感器的移动设备(如手机、平板电脑等)构成的感知网络。它目前还处在初期研究发展阶段,还没有一个统一和严格的定义 [4-8] 。这里给出一个目前被学术界广泛认可的群智感知网络基本定义:
“ 普通用户的移动设备 ( 如手机 、 平板电脑等 ) 作为基本感知单元 , 通过移动 互联网 ( 如 Wi-Fi、 蜂窝网络以及有线网络等 ) 进行有意识或无意识的协作 , 实现 感知任务分发与感知数据收集 , 完成大规模的 、 复杂的社会感知任务 。” [4]
在当前计算机领域中,群智感知与参与式感知(Participatory Sensing) [5] 、社群感知(Social Sensing) [15] 以及众包(Crowd- sourcing) [16] 的概念很相似。它们都是以大量普通用户参与为基础,其基本思想都是一致的,即人多力量大,发挥群体的智慧。
虽然群智感知网络是近几年感知网络中提出的一个新概念 [5] ,但是这样的思想在互联网刚刚繁荣的时候就被人提出和应用。连线( Wired )杂志在 2006年提出了一种新的应用方式——众包(Crowd-sourcing) [17] 。它是指将一个任务以自由自愿的形式外包给互联网中的广大用户来完成。其中有两个典型的众包应用例子:一个是 1999—2004 年的足不出户外星人搜寻项目(SETI @home) [18] 。它是通过互联网将大量家用个人计算机中的闲置资源利用起来处理庞大的天文数据,以便于搜寻外星人的踪迹。另一个例子是《纽约时报》( The NewYork Times )利用广大用户输入验证码来帮助完成大量古老报纸的数字化输入存档。
虽然群智感知类似的思想很早就被提出,以及手机很早被发明和使用,但是直到最近几年群智感知网络才被正式提出和研究。这主要是因为最近几年下面 4 种技术发展的强力推动:
(1)传感器技术的飞速发展
随着微电子和嵌入式等技术的飞速发展,传感器价格越来越低廉、耗能越来越小以及种类越来越繁多 [2] ,这极大地推动了智能手机集成大量的、各种功能的传感器。如图 1.1 所示,目前智能手机常见的传感器通常包括加速度计(Accelerometer)、陀螺仪、指南针、GPS、麦克风、摄像头、距离传感器(Proximity sensor)、光照传感器(Ambient light sensor)以及各种无线信号(如GSM、Wi-Fi和蓝牙)检测器。随着传感器成本的不断降低,今后越来越多的传感器将集成到智能手机中,如化学污染检测传感器、心电图传感器以及空气质量检测传感器等 [7] 。
(2)智能手机的普及使用
群智感知网络是广大普通用户参与的网络,以参与用户数量规模大为前提。近年来智能手机的广泛使用和普及为群智感知网络的发展提供了必要条件和推动力量。据国外调查机构统计,截至 2021 年年底,全球智能手机使用数量已达到39 亿,预计到 2024 年将突破 45 亿,大约占全世界总人口数的 56%。
图1.1 智能手机中常见的传感器
(3)智能手机的开放性和应用商店的兴起
近年来,智能手机的研究和开发蓬勃发展。智能手机的计算、存储、通信和感知能力不断增强。这为手机上运行各种感知应用程序提供了必要条件。同时,手机制造商为手机软件开发提供了很多便利的接口,如手机的安卓系统开发接口,使智能手机应用程序开发很简单和方便,各种各样的手机应用软件大量出现。据统计,2022 年苹果应用商店(App Store)中总应用程序数量超过了180 万个。
很多开发商提供了一个公共的网上应用程序商店,便于开发者的软件发售以及用户的购买和下载,如豌豆荚和苹果应用商店等。应用商店的出现极大地推动了手机应用程序发布的规模和速度,有助于实现大规模的群智感知网络。
(4)高处理和存储能力的计算中心的出现
随着计算机硬件技术的发展,计算机的计算和存储能力不断增强。同时,云计算(Cloud Computing)和云存储技术不断发展,并被工业界广泛使用 [21] ,如亚马逊云存储和 163 云存储邮箱等,这使得大规模数据的存储和处理成为可能。在群智感知网络中,用户数量众多和感知数据种类复杂,导致它的感知数据总量非常庞大 [4] 。云计算和云存储技术的发展为群智感知网络的兴起提供了必要条件。
2 )群智感知网络的架构
目前学术界和工业界对群智感知网络的架构尚未达成共识。例如,一些专家基于用户隐私保护的考虑,认为用户的原始感知数据不应该直接传送到云中心服务器;另一些专家认为在用户手机端处理原始数据将消耗大量的电能以及占用手机的处理存储资源,从而阻碍更多的用户参与群智感知网络中。考虑上述因素,本书综合了群智感知网络的几种不同架构 [6-7] ,提出了如图 1.2 所示的基本架构。
按照数据的感(感知)、传(传输)和用(应用)的流程,群智感知网络可分为3 层:感知层、传输层和处理应用层,如图 1.2 所示。
图1.2 群智感知网络的架构图
(1)感知层
感知层是群智感知网络中数据获取的基本层和核心层。它利用智能手机等移动设备上集成的大量传感器对物质性质、环境状态、行为模式以及人的状态等信息进行感知。例如,加速度传感器可以感知物体运动的加速度以及城市道路的平坦程度等信息 [22] ;麦克风可以感知城市的噪声污染水平 [23-24] ;GPS传感器和Wi-Fi信号检测器可以感知物体的位置和速度等 [25] 。在感知层,当前大部分研究主要关注手机感知数据过程中的能量节省和隐私保护。例如,很多群智感知应用需要手机进行连续感知,如人的社交关系感知,但是考虑手机的能量有限,文献[15]研究和解决在不丢失有用数据的前提下,如何降低感知频率来降低手机耗能等。
(2)传输层
传输层的主要作用是把下层(感知层)感知的数据传送到云中心服务器中。群智感知网络利用已部署的网络设施进行数据传输。由于用户众多和庞杂,且每个用户的设备以及所能连接的网络各不相同,因此,传输层包含的网络众多。首先,互联网以及下一代互联网是群智感知网络传输层的核心网络;其次,各种无线网络被广泛利用。例如,无线广域网包括现有的移动通信网络以及其升级技术(4G和 5G)是群智感知网络中将用户手机感知的数据传送到中心服务器的一种主要方式。随着当前Wi-Fi大面积部署和使用,无线局域网可为一定区域内(如家庭、校园、街道和商场等)的用户提供通信网络。无线局域网(如蓝牙)可以将部分用户的感知数据通过其他用户的中继,传输到中心服务器。此外,由于可能有些用户在某些场景或者某些时间内没有任何网络可获取,因此,容迟网络技术(Delay Tolerant Network,DTN) [26] 可被用来将感知数据传送到中心服务器 [27] 。在群智感知网络中,数据通信的可靠性和实时性不能得到保证。
(3)处理应用层
大量的感知数据被传输层中的各种网络传送到云中心服务器中。在处理应用层,云中心服务器对这些感知数据进行存储和处理,以实现各种应用任务。但是,在群智感知网络中,由于大量未经训练的用户作为基本的感知单元,因此,感知数据存在不精确、不完整、不一致和不及时的问题。同时,用户感知设备的多样性以及感知方式的随意性使感知数据的质量参差不齐 [28] 。对感知数据进行去伪存真、误差校正以及去粗取精的处理是实现群智感知网络的重要一环。如果数据不被处理,这些不准确、不可靠和不完整的数据很难用于各种应用中,将成为一堆无用的数据。处理应用层是群智感知网络的重要一环。
另外,在处理应用层中,各种群智感知应用程序被发布到广大用户中。例如,服务提供商将应用程序发布到应用商店中,用户通过上网到应用商店中下载和安装这个程序到手机中,从而参与相应的群智感知应用中。
3 )群智能感知网络的特点
基于上面所述的群智感知网络基本架构模型, 群智感知网络的主要特点 可以概括如下:
(1)以低成本实现大规模和细粒度的感知
由于群智感知网络利用用户现有手机中的感知设备进行感知,同时,用当前已部署的网络进行数据传输,无须部署和维护感知设备和传输网络,群智感知网络的成本被大大降低。此外,由于手机使用的普适性、用户分布的广泛性和自然移动性,群智感知网络能够实现大规模、细粒度的感知,如城市环境感知 [23] 等,因此,群智感知网络能够以非常小的耗费实现大规模、细粒度的感知。这是群智感知网络相对于当前传统的感知网络(如无线传感器网络)最突出的优势,也是它近年来受到学术界和工业界广泛关注和追捧的主要原因。
(2)用户无意识性和不可控制性
为了避免给感知用户带来更多的负担,鼓励用户参与感知网络中,群智感知网络不干预用户手机的正常使用,也不要求用户手动地参与感知,如用户手动地输入一些信息和反馈等。感知任务都是自动地在用户手机中进行,用户是无意识的。
由于用户是自愿参与感知,且大部分都是未经训练,系统对众多用户的可靠性以及感知设备的性能等信息了解很少,因此用户的设备性能很难控制。同时,群智感知网络中的用户都是松散组织,系统很难对用户进行控制,如使感知用户配合校正感知设备等 [28] ,用户的行为和感知设备性能不可控制。
(3)感知数据的不准确性和不可靠性
基于成本和能耗的考虑,当前大部分智能手机都是集成低成本、低功耗的传感器,其感知数据不准确、误差很大。进一步,用户设备的多样性且各种感知设备的精度差别较大,使得感知数据的误差各不相同。此外,感知用户的行为不可控制,导致感知的数据不可靠 [29] 。例如,用户为了节约电量,关闭手机或者感知程序;用户上报虚假感知数据到中心;网络的不可获得导致数据传输的不可靠等。
4 )群智感知网络与无线传感器网络的比较
在大力发展了十几年如何利用特定的有意识部署的传感器网络提供感知服务之后,物联网下一步发展的重要方向是如何把无意识的现有设备提供的感知能力融合起来,即群智感知网络。群智感知网络是当前传统无线传感器网络的一种新发展,共同构成了物联网中两种重要的感知网络。它与无线传感器网络之间既有联系又有区别。
(1)群智感知网络和无线传感器网络之间的联系
它们都是感知网络,都能实现大规模、细粒度的感知任务。从本质上讲,群智感知网络是一种特殊的无线移动传感器网络,即用户现有手机中的感知设备作为传感器,手机的无线通信网络(如蜂窝网络、Wi-Fi等)作为传感器网络中的无线通信网络,自然移动的用户作为传感器移动的载体。群智感知网络是无线传感器网络的一种新发展。
(2)群智感知网络和无线传感器之间的区别
作为无线传感器网络的发展,群智感知网络与它存在很大的区别,主要表现如下:
①无线传感器网络需要为了某个特定的应用任务在某个特定的区域有意识地进行专门部署和维护,耗费大;群智感知网络利用用户现有的感知设备和网络通信设施,无须专门部署和维护,耗费小。这是群智感知网络较之传统无线传感器网络的最大优势。
②无线传感器网络能够对各个传感器的性能和行为进行控制,如部署前校正传感器等;群智感知网络对每个用户感知设备的性能了解很少,同时,对用户的行为无法控制,这给群智感知网络的实现带来巨大的挑战。
③无线传感器网络能够保证精准的数据感知和可靠的数据传输;群智感知网络却不能保证,只能依靠参与感知用户的规模性以及感知数据的多样性来解决数据的不准确和不可靠问题。
群智感知网络可广泛应用在日常生活的各个方面,如交通、环境以及社交等 [7] 。目前,关于各个应用领域的群智感知网络已有大量的研究成果,并提出了很多实际系统。根据应用领域来分类,当前研究工作可以分为环境感知、公共基础设施感知以及社会感知 3 类 [7] 。
1) 环境感知
群智感知网络适用于感知人们日常生活环境的各种信息,以避免各种环境污染带来的伤害以及方便人们的生活出行。当前的群智感知环境系统可分为以下两种:
(1)利用群智感知网络对环境的空气质量进行监控的系统
CommonSense系统 [30] 利用一个便携的手持空气质量感知设备与用户的手机相连,构建了一个城市空气质量监控系统。首先,它通过对参与的普通用户、专家以及管理部门的调研,提出了数据收集和知识表示的设计原则和框架;其次,设计了一个以用户为中心的系统来分析空气质量感知数据。与传统其他系统不同的是,这个系统将数据分析任务分解到各个具体的小应用中,便于充分利用各个感知数据。 SensorMap系统 [31] 利用各个汽车上安装的空气质量感知设备来构建城市空气质量监测网。这个系统主要关注系统实现,文献[31]只简单地介绍了这个系统的实现框架。 Peir系统 [32] 充分利用Web网的分布式处理能力和用户手机的个人移动感知能力,构建了一个监控用户所处环境的系统。它主要解决和实现 4 个关键技术,即GPS数据收集、基于隐马尔科夫的用户行为分类[HMM(Hiden Markov Model) based Activity Classfication]、位置数据的自动划分以及环境影响与人行为的关系模型构建。同时,这个实际系统在 2008年基于 30 个志愿者运行了 6 个月,文献[32]根据这些实验数据对这个实际系统的性能进行分析和评估。
(2)利用群智感知网络对城市的噪声污染程度进行感知的系统
文献[23-24]利用智能手机中的麦克风和GPS传感器来感知和构建城市噪声分布地图,实时监控城市噪声污染情况。基于一个噪声计算模型,利用十阶数字滤波器(Tenth- order Digital Filter),根据手机麦克风采集的感应电压值来计算噪声水平。感知用户的不可控性和不可靠性,导致感知数据不完全,大部分位置都没有感知数据。针对这个问题,文献[23]利用噪声感知数据在空间的相关性,基于压缩感知(Compressive Sensing,CS)方法,将稀疏的感知数据恢复成完整的噪声地图。
2) 公共基础设施感知
群智感知网络常被用来对城市的公共基础设施进行感知和监控,如道路交通以及城市停车位等。
(1)对道路交通的监控
CarTel系统 [27] 利用汽车上配备的专有设备(如GPS、摄像头以及Wi-Fi检测器)对道路情况进行感知,如道路交通、道路周边Wi-Fi接入点的通信质量等。在这个系统中,各个汽车利用携带的传感器和计算设备采集和局部处理感知数据,通过公共无线网络(如Wi-Fi)将感知数据传到中心数据库,便于进一步的分析和可视化显示,为各个用户提供交通情况的实时查询服务。同时,这个系统在一个基于 6 台汽车上的小型部署系统中运行了一年。 CarTel系统要求各个汽车配备专有的传感器,成本较高。为了解决这个问题,Nericell系统 [22] 充分地利用汽车驾驶员手机上的各种传感器(如加速度计、GPS、麦克风、蜂窝信号检测器等),无须额外的专有设备和部署就能对城市交通和道路质量(如凹凸不平)进行监控。文献[22]主要侧重于研究Nericell系统的感知模块。首先,针对手机中加速度传感器的感知数据无方向性,提出了一种虚拟定向算法来确定加速度感知数据的方向,并基于一个简单的阈值来检测道路的颠簸和空穴;其次,利用手机中麦克风感知数据来识别喇叭蜂鸣声;再次,提出了一种利用手机感知的蜂窝基站信息对手机进行粗略定位的方法,以便于节能;最后,为了进一步的节能,提出了一种触发感应技术(Triggered Sensing),利用低耗能传感器的连续感知,来触发高耗能传感器,从而减少高耗能传感器的感知频率和次数。GPS传感器耗能大,同时很多环境下GPS感知数据不可获得(如建筑物密集的街道中),针对这个问题,VTrack系统 [34] 仅仅利用手机上低耗能的Wi-Fi信号检测器来估计城市交通的拥塞情况。针对Wi-Fi信号定位误差大的问题,文献[34]利用基于隐马尔可夫的地图匹配机制和行走时间估计方法,对稀疏感知数据进行插值以识别出用户最大可能经过的路径,同时将行走时间匹配到该路径中。 BikeNet系统 [35-36] 利用骑行爱好者自行车上配备的各种传感器和智能手机,对骑行道路周围的空气质量和道路情况进行感知和分享,使骑行者对环境有一个实时的了解,以便路径选择和达到最优骑行体验。 CrowdAtla系统 [37] 针对当前电子地图更新不及时、更新成本高的问题,利用城市中大量用户手机和汽车的GPS传感器的感知数据来构建一个实时更新的城市道路地图。利用基于隐马尔可夫的地图匹配算法来检测GPS感知数据与当前地图道路之间是否有差异。如果检测到存在,则用一种基于聚类的地图推理算法将新的道路轨迹更新到地图中。同时,文献[37]在上海市 4.5 km 2 的街区搭建了一个实际的基于群智感知网络的城市道路交通地图实时更新系统。
文献[38]提出了一种基于群智感知网络的公交车到达时间实时预测感知系统。它主要利用各个公交车上众多乘客的手机自动感知和上传当前位置和时间等信息到中心服务器,从而使中心服务器可以对公交车的到达时间准确、实时地进行预测。首先,利用手机的麦克风来感知公交车IC卡阅读器的蜂鸣声,从而检测用户是否上了公交车,如果检测到已上公交车,则用户的手机自动地感知周围附近的蜂窝基站ID号;其次,提出了一种top- k蜂窝基站集合序列匹配算法来区分不同的基站序列,并匹配到各个公交车路线上;最后,中心服务器利用收集的用户感知数据以及当前交通状况信息,准确地预测公交车的到达时间。
(2)对城市停车位的监控
Parknet系统 [39] 利用汽车上的GPS传感器和配备的超声波测距仪对停车位是否空闲进行监控,并将感知数据上传到服务器,从而构建一个城市停车位实时监控系统。针对GPS感知数据精度低的问题,这个系统利用环境指纹(Envirnment Fingerprint)来提高定位精度。这个系统需要在汽车上配备专有的超声波测距仪,它的成本较高,且很难大规模地实现。为了解决这个问题,ParkSense系统 [25] 不需要汽车配备任何专有感知设备,只需驾驶员现有手机就可以对停车位实时、自动地进行监控。它利用了手机上低耗能的Wi-Fi信号感知设备,既降低了系统的成本,又节省了手机感知的能耗。具体地,它提出了一种Wi-Fi指纹匹配方法来判断用户是否回到停车位,同时,利用Wi-Fi指纹的变化速率来检测用户是否将车开走,从而准确地感知停车位是否空闲。文献[25]通过实验得出一个很重要的观察,即手机Wi-Fi指纹的变化速率能够很好地表征手机的移动速率。
3) 社会感知
手机经常随时随地携带在人们身边,这为记录人的社会行为提供了一种很好的方法。群智感知网络可以为研究人类的社会行为提供一种新的、便利的途径,它利用用户随身携带的手机对用户的社会行为等信息进行感知,如运动时间、交往人数和次数等,然后社会行为科学家通过对大量人群感知数据的分析,研究人类的社会特征,如社交关系、活动性(Interactive)等 [15] 。这种基于群智感知的方法比传统的问卷调查法和携带附加设备测量法更准确、更客观和更人性化。 SociableSense系统 [15] 利用手机的蓝牙设备、加速度传感器和麦克风来感知和记录用户与其他人之间的交互信息,然后根据这些感知数据来定量分析用户的社会属性以及活跃程度,为用户提供社交建议。首先,提出了一种基于强化学习机制(Reinforcement Learning Mechnism)的传感器采样方法,自适应地控制加速度传感器、蓝牙以及麦克风的采样速率,以在耗能、感知精度和感知时延三者之间很好地进行折中;其次,提出了一种基于多准则决策理论(Multicriteria Decision Theory)的计算任务分配方法,动态地决定计算任务在何处执行(如在手机上或者云服务器中),以在耗能、计算时延以及网络传输数据量三者之间很好地进行折中;最后,提出了一种社交属性计算方法,基于手机感知的数据来计算用户的社交属性、与朋友关系的强度等,并反馈给用户。另外,群智感知网络还可以感知人们的日常生活,如在DietSense系统 [40] 中,每个感知用户用手机拍下自己每顿吃的食物,并分享到社区中,便于比较每个人的饮食情况。这个系统的一个实际应用是社区中的用户可以观察其他人的饮食,给出建议或者帮助控制。
4 )群智感知网络中的研究问题
综上,虽然当前有很多关于群智感知网络的研究,提出了一些实际的群智感知网络系统。但是群智感知网络的研究还处在初级阶段,还有很多关键问题需要解决 [8] 。 群智感知网络中的研究问题 主要包括以下三大类:
(1)用户的安全隐私保护
群智感知网络的一个重要特征是它潜在地收集用户的个人敏感信息。例如,用户手机的GPS位置可以被用来推断用户的一些私密信息,如,他上班以及回家等日常行走路线,可以通过统计他常在的位置推断他的职业、兴趣和爱好等 [37] 。用户手机的蓝牙和Wi-Fi信号检测数据可以被用来推断用户的社交关系,如,他与哪些人遇见过,他在社会交往中是否活跃等 [15] 。更严重的是,用户手机的麦克风感知信息可以被用来获取用户的日常谈话内容等。另外,在群智感知网络中,分享用户的感知数据可获取很多有价值的信息。例如,大量汽车驾驶员手机的GPS感知数据可被用来推断某个城市的道路交通拥塞情况 [27] 。用户的蓝牙、麦克风感知数据可被社会学科学家用来研究人类社交网络的一些特征和属性等 [15] 。在群智感知网络中,既要保护用户个人的安全隐私不被泄露,又要确保群智感知应用的实现非常重要,具有很大的挑战。同时,群智感知网络中用户众多,可能存在恶意的用户贡献错误的数据给系统。确保感知数据的完整性(Data Integrity)是一个很重要的问题。
当前有很多传统的保护用户安全隐私的方法。例如,匿名化处理(Anonymization) [41] 。这种方法是指在数据分享给第三方之前,将数据中可被用来识别出用户的信息去除掉,如位置信息以及用户的ID信息等。这种方法的缺点是不便于群智感知应用的实现,如去除了GPS信息很难推断道路交通拥塞情况。另一种保护隐私的方法是安全多方计算(Multiparty Computation) [42] 。它利用加密技术来传输数据,以保护数据的隐私。这种方法的计算复杂度很高,并且要产生和维护多个密钥,很难用于大规模的群智感知网络中。当前有很多验证数据完整性的方法,如文献[43-44]提出了一种感知数据签名方法等。总之,虽然当前已有很多传统保护隐私的方法,但是它们都没有完全解决群智感知网络的隐私保护问题。既要保证群智感知网络系统功能的实现又要保护用户的隐私目前还是一个开放的问题。
(2)用户的激励机制设计
在群智感知网络中,当用户在完成感知任务时,可能会耗费自己的能量资源,如手机的电量以及计算资源等。同时,用户分享了自己的感知数据,潜在地受到隐私泄露的威胁 [8] 。只有当用户得到了对他们资源耗费和隐私泄露威胁等损失足够的补偿后,他们才会有兴趣自愿加入群智感知网络中。更进一步地,群智感知网络的感知质量紧密地依赖大量用户的感知,如果没有足够的用户参与感知,群智感知网络很难达到很高的感知质量。用户激励机制的设计是实现群智感知网络的基础和前提,对群智感知网络的大规模应用具有重要的意义 [8] 。
目前已有一些关于激励机制设计的研究。文献[45]设计和提出了一种群智感知用户的招募平台(Recruitment Framework),以便应用发起方可以根据用户的行为习惯、时空可得性等方面来选择合适的感知用户。但是,这种方法主要关注用户的选择,没有考虑激励机制的设计。目前关于群智感知网络中激励机制设计的研究还比较少。文献[46]主要考虑群智感知网络中用户的位置私密性,通过实际实验来分析位置私密性公开应得的补偿。最后,它基于这些实验结果提出了一种次高叫价拍卖机制(Sealed-bid Second-price Auction)来计算用户应得的补偿,从而激励用户参与到群智感知网络中。文献[47]提出了一种基于反向拍卖的动态价格设计机制(Reverse Auction based Dynamic Price Incentive Mechanism)。在这种机制中,用户将感知数据卖给服务提供者并宣称一个卖价。目标是使激励耗费最小且稳定,同时保证有足够的用户参与群智感知网络中。作为目前研究的最新进展,文献[17]考虑群智感知网络中以平台为中心的模型(Platform-centric Model)和以用户为中心的模型(User-centric Model),并分别提出了基于双寡头博弈模型的激励机制(Stackelberg Game based Incentive Mechanism)和基于竞标的激励机制(Auction based Incentive Mechanism)。
(3)数据感知质量管理
群智感知网络利用用户现有的设备进行感知,虽然具有成本低、感知规模大以及粒度细等优点,但同时带来了数据感知质量管理这一巨大的挑战。
群智感知网络依靠普通用户现有手机中的感知设备来获取数据信息,而当前大部分手机中的感知设备都是低成本和低功耗的,导致感知数据的误差很大。同时,用户设备的多样性导致不同用户感知数据的误差各不相同,如不同型号手机感知数据的精度不同。在手机不同使用方式下感知的数据精度也不相同,如手机拿在手里、放在衣服口袋里以及放在背包中。在群智感知网络中,由于用户不可控制,要求用户合作对其手机的感知设备进行校正是很难实现的,因此群智感知网络的感知数据是不准确的。
此外,大部分用户未经训练且不可控制,他们的感知数据不可靠和不完全。例如,有些恶意用户故意错报数据;用户当前不能获得任何网络连接,数据不能传输到中心等。群智感知网络的感知数据又是不可靠的。
如果不对这些不准确和不可靠的感知数据进行处理,很难直接用于各种感知应用中。数据感知质量管理是实现群智感知网络的关键。换言之,在群智感知网络中,数据获取较容易,关键在于解决感知数据的不准确性和不可靠性问题,即数据感知质量管理。在传统的传感器网络中,传感器可以在部署前进行校正或者其感知误差已知,它们的数据感知质量管理不是问题,而关键在于数据的获取,如传感器如何降低感知耗能,并可靠地将数据传送到中心。
当前有少量关于群智感知网络中数据感知质量管理的研究。文献[29,48-51]只考虑最简单的群智感知网络,即用户的 0-1 感知。例如,用户发现街道内某个特定的位置有垃圾,则上报 1,否则上报 0。但是在大部分的实际群智感知网络中,用户的感知数据远比 0-1 数据复杂,如污染源检测数据、信号强度感知数据等。而在实际复杂的群智感知网络中,数据感知质量管理问题还未解决。文献[23]主要解决群智感知网络中数据不完全的问题,没有考虑感知数据的误差。总体上讲,当前对群智感知网络中数据感知质量管理问题研究还处在初级阶段,还有很多问题没有解决。其中,主要的 3 个问题如下:
① 去伪存真问题 :大量来自用户的感知数据都不准确和不可靠。如何从这些不可靠的感知数据中识别出真实信息,对群智感知网络的应用来说非常关键。但是,用户的感知误差和可靠性都未知且各不相同,使解决去伪存真问题很困难。
② 误差校正问题 :在群智感知网络中,用户低成本的感知设备具有较大的感知误差,导致感知数据很不准确。校正用户的感知误差对提高感知数据精度非常重要。用户感知设备和使用方式的多样性,使用户的感知误差各不相同。同时,感知用户具有不可控制性,很难使他们合作将感知设备校正。在感知用户不合作的情况下,校正用户的感知误差是一个具有挑战性的问题。
③ 去粗取精问题 :群智感知网络中用户众多,各个用户的感知质量各不相同且未知。如何基于大量的用户感知数据对各个用户的感知质量进行评估,以识别出各个用户感知质量的高低。解决这个问题对群智感知网络中感知用户的选择、用户的激励机制设计以及评估感知数据融合精度都非常重要。如何对用户的感知质量进行准确、全面的评估是一个难以解决的问题。
本部分研究群智感知网络中数据感知质量管理技术,主要针对去伪存真、误差校正和去粗存精 3 个方面的问题展开深入研究。
本部分内容的框架如图 1.3 所示。首先,基于高斯的感知噪声理论模型,针对感知数据的不可靠性问题,提出了感知误差未知情况下的真实污染源识别方法,解决了数据感知质量管理中的去伪存真问题。其次,针对感知数据的不准确性问题,提出了信息缺失和用户不合作条件下的感知误差自校正方法,解决了数据感知质量管理中误差校正问题。再次,针对用户感知质量的不确定性问题,提出了基于置信区间的用户感知质量评估方法,解决了数据感知质量管理中去粗存精问题。最后,在前面理论模型研究的基础上,探究和解决实际群智感知网络系统中数据感知质量问题。根据实际系统的实验观察,提出了基于群智感知数据的室外大规模无线信号强度地图构建方法,解决了非高斯感知噪声下感知数据的不准确和不完全问题。本部分主要研究内容和贡献具体如下:
①考虑利用群智感知网络进行大规模城市污染源监控场景,研究如何基于不准确和不可靠的感知数据识别出真实的污染源,提出了一种基于群智感知数据的真实污染源识别方法。首先,联合聚类模型和参数估计,以获得候选的污染源和它们的参数估计值;其次,基于最大期望方法,提出了一种真实污染源最优识别算法,从候选污染源中准确地识别出真实源。仿真结果表明, 在未知污 染源参数和数据感知误差的情况下 , 所提方法利用感知用户的随机游走性和感 知数据互验证特性,通过有限次迭代实现了真实污染源的准确识别。
图1.3 本部分内容的框架
②研究数据感知质量管理中误差校正问题,提出了基于群智感知数据的感知误差自校正方法。首先,对传统最大期望(EM)方法进行扩展,提出了基于两层迭代的感知误差自校正算法,先利用容限估计方法对误差进行粗估计,再逐步提高精度,有效地解决了感知事件未知、污染源参数和感知误差都未知条件下EM方法不适用的问题。对算法的收敛性和最优性进行理论分析和证明。理论分析和仿真结果表明, 所提方法仅仅基于不可靠的用户感知数据 , 在感知 用户不合作校正和无法利用真实信息实现主动校正的情况下 , 通过有限次多层 迭代仍然可以实现感知误差的自校正 。
③研究数据感知质量管理中去粗存精问题,提出了基于置信区间的用户感知质量评估方法。首先,利用基于最大期望的迭代估计算法,得到用户感知质量和污染源参数的最大似然估计值;其次,基于这些估计结果,利用最大似然估计的渐近正态性和Fisher信息,计算各个用户感知质量的置信区间。仿真实验结果表明, 所提方法解决了感知质量和污染源的不确定性问题 , 能够对不确定的用户感 知质量确定地 、 准确地进行评估 。
④研究实际群智感知网络系统中数据感知质量管理问题,提出了基于群智感知数据的无线信号强度地图构建方法,并在实际系统中进行验证。首先,搭建了一个实际的基于群智感知网络的城市大规模室外无线信号强度地图构建系统。其次,通过这个系统的实验观察发现,感知数据不准确、不完全,且感知误差不服从高斯噪声模型。为了解决这个问题,提出了一种基于群智感知数据的信号强度地图构建方法,利用室外无线信号传播模型和用户感知误差校准模型之间的空间关系,通过迭代构建精确完整的信号强度地图。最后,利用实际系统验证了方法的性能。实验结果表明, 所提方法能够获得平均误差为 8.5 dBm 的精确信号强度地图 ( 比传统基本方法降低了 57%), 为认知无线电的频 谱分配和接入端的定制化服务提供了有效支撑 。
本部分的组织结构如下:
第 1 章首先介绍本部分的研究背景及意义,其次对当前国内外关于群智感知网络的研究现状进行综述,最后介绍本部分的主要研究内容和贡献。
第 2 章针对群智感知数据的不可靠问题,对数据感知质量管理中的去伪存真问题展开研究,提出了一种基于群智感知数据的真实污染源识别方法。
第 3 章针对群智感知数据的不准确问题,对数据感知质量管理中的误差校正问题展开研究,提出了基于群智感知数据的用户感知误差自校正方法。
第 4 章针对用户感知质量不确定问题,对数据感知质量管理中的去粗取精问题展开研究,提出了一种基于置信区间的用户感知质量评估方法。
第 5 章在第 2、3、4 章研究的基础上,搭建了实际的基于群智感知网络的无线信号强度地图构建实验系统,研究这个实际系统中数据感知质量管理问题。针对这个实际系统中非高斯感知误差,提出了一种基于群智感知数据的实际无线信号强度地图构建方法。
第 6 章对本部分内容进行总结,并介绍了本书的后续工作。