广义而言,社会是由共同生活的个体与外部环境形成的关系总和,其中个体可以为人,也可以是其他动物或生物。个体与外部环境在交互过程中,形成了多种多样的关系。在动物社会中,这种关系可以表现为捕食关系、协作关系、竞争关系。如图0-1所示,动物为了得到更多的食物和水源,争夺领地和交配主动权,逐渐形成集体;随着群体规模的扩大,群体将形成特定的分工协作模式。例如根据生理差异,蚁群可以划分为具有生殖能力的蚁后和雄蚁以及不具有生殖能力的工蚁。狼群内部则有高度的组织性,形成了特有的列队模式,从而确保狼群内部成员的团队合作。在人类社会中,关系则具有更丰富的含义,例如兴趣爱好、社会事件、经济关系等。错综复杂的关系将不同的个体交织联系在一起,形成了形形色色的复杂关系网络。由此可见, 个体、关系 和 网络 构成了社会的三个核心要素。
社会学的研究对象为社会行为和人类群体,其研究范围广泛,包括了微观层级的社会行动或人际互动,以及宏观层级的社会系统或结构。社会学的研究思维源远流长。《道德经》所提倡的“无为而治”治国理念,主张以制度(可理解为“道”中的规律)治国,以制度约束臣民的行为,臣民均遵守法律制度。《韩非子·说难》写道:“宋有富人,天雨墙坏。其子曰:‘不筑,必将有盗。’其邻人之父亦云。暮而果大亡其财。其家甚智其子,而疑邻人之父。”其大意是:宋国有一个富人,因天下大雨,他的墙坍塌下来。他儿子说:“如果不赶紧修筑它,一定有盗贼进来。”其邻居的父亲也这么说。可富人并没有听他们的建议。这天晚上果然丢失了大量财物。富人则极力赞赏儿子聪慧,却怀疑偷盗的是邻居的父亲。这个故事则说明社会网络中的强弱关系对个体认知的影响作用。同样地,孟母三迁和“近朱者赤、近墨者黑”等都反映了环境对个体行为的影响。西方社会学研究最早起源于18世纪的法国,在法国大革命的背景下,以奥古斯特·孔德为代表的哲学家认为亟须发展社会的理论科学,首次提出“社会学”(Sociology)概念,并创立了实证主义学说,强调个人是社会的构成要素,个人的特性关系到社会的特性。早期的社会学研究以科学主义实证论的定量方法和人文主义的理解方法为主,缺乏有效的量化分析方法。社会科学的发展推动了统计学、数学和计算的进步,为定量地进行社会学研究提供了方法基础。
图0-1 多种多样的社会关系
最早的量化社会学分析研究与传染性疾病霍乱的暴发密切相关。19世纪30—50年代间,霍乱先后四次在英国多地暴发。早期的研究认为,霍乱通过空气传播,主要是由有机物质腐败所释放的有毒气体所导致。1854年,霍乱在伦敦第四次暴发,10天内有超过500人死亡。医生约翰·斯诺获取所有病例的住址信息,并将其在地图上绘制出来(见图0-2)。通过分析发现,死亡病例多分布在一个公共水井附件的街区。距离水井越远,死亡人数越少。而附近啤酒厂的工人却因为从工厂内部的水井汲水而无一人感染霍乱。为此斯诺将霍乱的病因锁定为被污染的水源,并建议市政厅关闭这一公共水井。水井关闭后,霍乱很快就在这个街区销声匿迹了。
与传染性疾病的传播类似,人类的认知和行为也表现为传染性。例如科学概念的大范围传播和讨论、人类行为和情绪在社群内部的扩散等。美国哈佛医学院的尼古拉斯·克里斯塔基斯(Nicholas Christakis)教授和加州大学圣地亚哥分校医学院的詹姆斯·福勒(James Fowler)教授发现社会行为和社会情绪具有传染性 [2] 。例如他们发现肥胖能够通过社会关系进行传播。如果你有朋友过度肥胖,那么你变肥胖的概率会增加57%;如果你朋友的朋友有肥胖症,你患肥胖症的可能性会高出25%;如果你朋友的朋友的朋友——一个你可能都不认识的人患有肥胖症的话,你患肥胖症的可能性会高出10%。同时研究发现传染性广泛地存在于各种社会现象中,例如吸烟 [3] 、投票 [4] 、自杀 [5] 、运动 [6] 、离婚甚至于情绪 [7] 等。麻省理工学院的科研人员研究了健身运动行为的传染性问题 [6] 。他们收集了一个全球性的健康追踪(Fitness Tracking)网络超过1000000人历时5年的运动数据,包括距离、速度、时间和卡路里消耗等,共收集到约59000000个运动事件。同时,他们还获取了用户的基本信息(性别、年龄、身高、体重、国家、学历)及彼此之间的社交关联。通过数据分析,发现以下现象(见图0-3):1)人们更容易被与自己锻炼水平差不多的人传染。2)锻炼不积极的人影响锻炼积极的人比锻炼积极的人影响锻炼不积极的人更多。3)不坚持的人影响坚持的人比坚持的人影响不坚持的人更多。4)两个人的共同好友数量越多,那么两个人对彼此的影响就越大。根据上述现象,总结得到以下结论:人们会被比自己好的人激励,也会因为怕被比自己差的人超过而努力,但总的来说下行比较的效应远大于上行比较。
图0-2 约翰·斯诺与其绘制的伦敦霍乱的病例空间分布 [1]
通过上述案例,发现典型的社会学研究框架可以抽象为: 数据+方法 → 结论 。其中,数据往往从历史记录或者调查问卷中获取;研究方法多以统计分析为基础。传统的数据获取方式具有以下不足:1)数据获取的时间成本高,难以在短时间内获取大量的有效数据。2)数据质量低,调查问卷中往往存在偏差大,难以去除个体差异的问题,致使分析结果存在偏差。3)数据片面化,往往是某一种或某一类数据,缺乏多样化的数据支持。4)样本偏差问题,导致所形成的结论缺乏广泛适用性。就研究分析方法而言,传统的统计分析方法具有严格的假设约束,且主要用于描述和归纳观察现象。 由于采样范围小、数据量少且工作量大,通过这种方法得到的结果往往是片面的、不准确的,结果的生成时间也比较长。
图0-3 运动行为的传染性 [6]