购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

0.3.1 社交大数据的获取与分析

随着社交媒体、移动互联网、智能感知终端的普及,海量异构数据的出现为社会学的研究提供了全新的研究对象,为传统社会学问题提供了新的突破口。由于新通信手段、交互模式和感知能力的发展,计算社会学在数据的获取与分析方面呈现出由被动到主动、单一到多样的发展趋势。

首先,大量群体用户在社交媒体平台上多种形式的自我表达和交互为研究个体及群体的行为特点、认知模式、网络拓扑演化、信息动态传播等提供了重要的观察数据,可以用来预测政治情绪 [33] 、交通状况 [34] 、自然灾害 [35] 等。然而,基于社交媒体的数据采集是被动的,需要被观测对象主动外化呈现部分观测信号,而且具有不连续性、滞后性等问题。虽然用户在信息空间的行为和物理空间的行为存在交织,但两者存在差异性,难以基于社交媒体数据对观察对象进行全面且深刻地刻画。随着无线通信技术和传感器技术的发展,尤其是智能手机、可穿戴设备以及大量公共基础设施的出现,用户在物理空间中行为、状态等能够实现准确感知和持续量化。例如,大量可穿戴设备以及体域网的出现为实现持续且非侵入式的数据采集提供了基础。图0-8展示了基于柔性电子织物构建的智能可穿戴手套。通过捕捉手指的细粒度行为,不仅可以实现高精度手势识别,而且支持基于手势的人机交互接口 [36]

图0-8 基于柔性电子织物的智能手套及智能交互系统 [36]

大规模移动设备的使用为感知群体的动态和交互提供必要手段。例如,为了研究肯尼亚濒危的斑马种群的迁徙轨迹和种群交互,普林斯顿大学开发了ZebraNet工程,通过将带有GPS定位功能的无线传感装置安装在斑马身上,不仅可以跟踪斑马的活动轨迹,而且能够记录斑马种群之间的交互情况,为斑马种群的保护提供了重要的研究数据 [37] 。类似地,人类在使用电子设备时留下了大量具有时空特征的交互记录。大量的移动轨迹数据对理解人类的移动规律 [19,27,38] 、城市的发展和演化 [39] 以及传染病的扩散与传播 [40-41] 等具有重要的价值。

计算社会学研究在数据分析层面一个重要的趋势是多源异构数据的融合,通过社交媒体空间中的自我表达和物理空间的持续感知,获取具有多样性和持续性的数据信息。例如早在2009年,哈佛大学教授Gary King在其著作《政治学之未来:100种观点》中指出,未来的研究可以从文本内容、选举活动、商业行为、地理位置、健康信息等数据着手,通过大规模与时序性数据的研究改变政治学乃至社会科学的基础。另外,传统意义上非社会学领域的数据也被用于社会学研究。例如大范围的社会经济状况普查往往需要耗费大量的人力和财力,而且数据采集的周期非常长。为此,斯坦福大学基于商业卫星的图像数据采用深度学习算法,对非洲地区的经济状况进行精准预测,极大地降低了社会统计的负担 [42-43] 。由于其泛在性和良好的空间分辨能力,通信信号(如WiFi、毫米波、雷达等)被用来感知目标群体的行为状态。例如美国麻省理工学院的CSAIL实验室基于射频信号可以实现遮挡或者黑暗环境下用户行为的感知 [44] 。北京大学基于WiFi信号实现用户行为的细粒度感知,为群体行为感知提供技术支持 [45] 等。

传统数据采集模式以被动式数据采集为主,难以对更大时空跨度的研究对象进行研究和分析。近年来,群智感知(Crowd Sensing)作为一种全新的数据采集方式在社会学研究中被广泛采用。该思想最早由美国《连线》杂志提出,指的是一种分布式协作的工作模式,大众通过工作参与的方式实现目标任务协作处理。随着各种移动设备和可穿戴设备的普及,如何利用泛在的传感器包括加速计、陀螺仪、摄像头、指南针、GPS、麦克风等进行大规模分布式感知成为一个全新的问题。为此,群智感知应运而生,其本质是一种采用“众包”思想最大化赋能移动设备感知能力的新型数据采集方式。具体而言,群智感知指大规模普通用户通过自身周边的移动设备进行数据采集并进行数据上传,服务器提供对数据的处理分析能力。显然群智感知依赖于人类的空间移动性和主动性,实现对大尺度多目标的感知,具有较强的移动性、扩展性和灵活性。当前群智感知技术已在众多社会学研究中得到了广泛应用。在环境监测中,CommonSense [46] 利用手持移动终端对空气质量进行大规模感知,并通过蓝牙与手机连接进行数据上传。Third-Eye则通过手机摄像头对空气的雾霾程度进行评估,从而实现对城市空气质量的动态监控 [47] 。NoiseTube [48] 和Ear-Phone [49] 利用手机的麦克风对环境噪声进行测量,并基于大规模用户数据构建城市的环境噪声地图。在公共安全方面,Medusa可以用来及时报告和跟踪突发事件 [50] 。GigaSight通过汇聚大量用户捕获的视频和图片信息,实现从大量人群中寻找丢失的孩子或者发现犯罪分子 [51] a4WETGiALMvyMRGrzPyobpH0LwiwmN8VxZEy6SBd2cYDQdXkTntihwaBBlpG4tat

点击中间区域
呼出菜单
上一章
目录
下一章
×