购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
数据来源与指标说明

一、大五人格的测量

本书所用的美国50州水平大五人格数据来自Rentfrow等(2008)关于美国州水平的大五人格研究,该数据集是通过Gosling-Potter互联网人格项目(Gosling-Potter Internet Personality Project)的非商业、无广告人格测试网站,搜集了1999—2005年间网络用户的人格数据。该人格测试采用的是被证明具有良好心理测量学指标的44 道题版本大五人格量表(John & Srivastava,1999)。被试被要求根据自己的实际情况,对44 个关于大五人格特质的简短描述的同意程度进行5 点式李克特评分(1=非常不同意,5=非常同意)。BFI问卷包括五个人格维度(在每个人格特质维度上的分值越高,代表该特质水平越高):

(1)外向性(Extraversion):主要反映精力充沛程度,积极情绪、自信、热衷社交性等倾向,其简短描述包括“爱说话”“有热情”“含蓄的”(反向题)等。

(2)宜人性(Agreeableness):主要反映对他人富有同情心、热情友好,偏好合作、和谐的人际关系倾向,其简短描述包括“乐于助人,无私”“天性宽以待人”“喜欢挑剔别人的毛病”(反向题)等。

(3)尽责性(Conscientiousness):主要反映行为的责任性、组织性、自律性等倾向,其简短描述包括“工作很周密”“可能有些粗心”(反向题)等。

(4)神经质(Neuroticism):主要反映对愤怒、抑郁等负面情绪体验的敏感程度,或者说情绪不稳定性程度,其简短描述包括“压抑而忧郁”“放松的,可以很好地应对压力”(反向题)等。

(5)开放性(Openness):即经验开放性,主要反映个体的创造力、对知识的好奇以及对新异事物的偏好程度,其简短描述包括“具有独创性,会产生新点子”“喜欢从事常规性的工作,不喜欢不确定性”(反向题)等。

该数据集的大五人格测试根据一套较为规范的标准,通过剔除重复作答等情况,最后得到了来自美国各州的有效被试619 397 人(约62 万人),其中女性占比55%,非裔美国居民占比4.0%,亚裔占比6.6%,拉丁美裔占比4.6%。为了检验该数据集在美国州水平上的代表性,研究者将被试的人口学分布特征与来自美国人口普查局(United States Census Bureau)2000年的普查数据进行对比。结果证实:各州被试数量在数据集上的分布与实际人口普查数据中的人口数量分布相关达到0.98,在非裔、亚裔、拉丁美裔、白人等种族特征上的州水平匹配程度分别达到0.88、0.96、0.96、0.93,在各类阶层上分布上的平均相关系数达到0.53(均在 p <0.001水平上显著)。研究者还对该数据集在州水平的大五人格问卷的信度、效度进行了检验,结果显示出了良好的重测信度和结构效度。例如,通过将样本随机分成数量相当的三个子样本进行聚合性分析(Convergent Analysis),结果显示州水平的人格特质在五个维度上的信度均在0.6以上,外向性为0.62、宜人性为0.80、尽责性为0.78、神经质为0.85、开放性为0.93。结构效度检验结果显示,在州水平的大五人格结构与个体层面的大五人格结构高度吻合,各维度的因子聚合系数都在0.85以上,总体人格结构的聚合系数是0.91。

总而言之,Rentfrow等(2008)关于美国各州水平的人格特征数据集在样本代表性、人格问卷的心理测量学指标上都具有较高质量,并成为目前美国州水平人格及其应用研究中应用最为广泛的数据源(例如,Rentfrow et al.,2009;Rentfrow et al.,2013;Rentfrow,2010;Obschonka et al.,2013;McCann,2011)。因此,本研究中关于美国50 州的区域人格数据也将沿用这一数据集,华盛顿哥伦比亚特区由于其特殊性暂不纳入本研究分析范围。

二、健康指标

(一)Gallup主观幸福感

本研究对于美国50州主观幸福感指标的测量,来自美国非常具有代表性的Gallup幸福生活指数(Gallup-Healthways Well-Being Index,GHWBI)调查数据。Gallup幸福生活指数旨在建立“健康的道琼斯指数”,该项目从2008 年起开始实施,并预计要持续25 年(McCann,2011)。每年的1 月2 日—12 月30日,Gallup公司将每天(重大节假日除外)对来自美国50州以及华盛顿哥伦比亚特区具有代表性的18岁以上的成人样本,随机抽取不少于1 000人的被试进行电话访谈,询问被试一系列与健康和幸福感相关的问题(Gallup,2009)。这些基于个体层面的幸福感调查数据还会在郡层面、州层面以及国家层面进行汇总,并且提供日、周、月、年度平均幸福感报告。

Gallup幸福感调查数据提供了来自生活评价(Life Evaluation)、情绪健康(Emotional Health)、工作环境(Work Environment)、身体健康(Physical Health)、健康行为(Health Behavior)、基本需要(Basic Access)共六个方面的幸福感子维度指数,以及基于这六个维度进行平均构建的总体幸福感(Overall Well-Being)。幸福感指数的六个子维度指数充分参考了世界卫生组织关于健康的定义,并且通过因子分析等方法最终确定。研究者在个体层面、州层面分别进行了幸福感调查的因子分析,通过特征根大于1的筛选标准得到了九个公因子,进而再通过对概念相近的维度,最终得到了以上六个维度。这六个维度分别是:

(1)生活评价幸福感:要求被试对当前生活状况和未来5年的预期生活状况,在0(代表非常糟糕)~ 10(代表非常好)的等级上进行评分,即生活满意度。

(2)情绪健康幸福感:主要对被试的日常体验和心理状态进行综合性的评估。例如,过去一天是否微笑、悲伤、愤怒等。

(3)工作环境幸福感:主要考察对工作环境的感受。例如,“你对你的工作满意吗”,“你的上司总是创造一种信任、开放的环境吗”等。

(4)身体健康幸福感:该分指标主要考察身体质量指数(BMI)、患病天数、身体疼痛等状况。

(5)健康行为幸福感:该分指标测量与健康密切相关的生活方式,包括抽烟、健康饮食和锻炼。

(6)基本需要幸福感:该分指标包含13 个关于居民对食物、住房、干净水、医疗、安全居住地等项目的满意度。例如,对社区或地区的满意度。

(7)总体幸福感:由以上六个维度平均综合得到,反映对各方面的综合满意度和幸福感。总体幸福感以及各子维度的幸福感指数均为分值越高,幸福感程度越高。

Gallup的幸福感调查数据也被广泛应用于学术研究。例如,Rentfrow等(2009)关于美国各州的幸福感的地理分布及其与人格、阶层、经济指标的关系研究,McCann(2011)关于美国州水平人格特质与情绪幸福感的研究等。本研究选取了根据Gallup幸福感调查数据的2013年幸福感年度报告及其州、社区和国会选区的幸福感分析报告(Gallup Healthways Well-Being Index,2013),选取了美国50州在2012年( N =353 564)和2013年( N =178 072)的总体幸福感数据以及六类子维度的幸福指数。为了构建一个相对稳健的幸福感指数,本书将2012年、2013年两年的总体幸福感指数以及六类幸福感分指数进行平均处理。

(二)Twitter幸福指数

基于Gallup调查的幸福感数据是幸福感研究中非常具有代表性的数据来源,但是其测量的仍然是个体的主观感受和评价,即自我报告的主观幸福感。近些年,随着社交媒体的普及和信息科学技术的发展,使得通过搜集、分析人们在社交媒体上客观行为来测量人们的情绪成为可能(薛婷等,2015)。这种通过分析人们在社交媒体上的发帖行为、发帖内容的方法,相比主观问卷调查的自我报告法更具客观性,同时其揭示的信息又是用户主动表达的内容,因此具有独特的分析价值。在基于社交媒体数据的幸福感研究方面,Mitchell等(2013)的研究以2011年美国约1 000万条带有地理位置的海量Twitter数据为例,开发了美国50州、近400个城市的幸福指数。该幸福指数的构建主要基于情绪词库的词汇匹配技术(乐国安等,2013),研究者建立了一个10 000 个标准有情绪分值的大型词库。该词库中各词汇的情绪分值由亚马逊土耳其机器人(Amazon's Mechanical Turk)对网络平台招募的大量被试一一进行人工评定得到(9点式评分:1代表悲伤、9代表快乐)。例如,“彩虹”一词的平均快乐程度是8.1,而“地震”一词的平均快乐程度是1.9。通过该方法构建的美国50州Twitter幸福指数,被证明与其他与幸福感相关的指标(例如,Gallup幸福感指数,美国经济与和平研究院的“和平指数”)具有较好的效标关联效度和区分效度。

为了保持与Gallup幸福感调查数据的可比性,本章将选择根据Mitchell等(2013)等研究方法构建的2012—2013 年间的美国50 州Twitter幸福指数数据,同样进行两年均值处理。Twitter幸福指数分值越高,代表该州在Twitter上客观表达出来的幸福感越高。

(三)预期寿命

寿命指标被认为是健康研究中争议最小且公认非常重要的健康指标(Friedman & Kern,2014),通常用预期寿命(Life Expectancy)来操作化。对于宏观大人群而言,例如国家,通常用人均预期寿命来表示。人均预期寿命,是基于当前该人群各年龄阶段的死亡率分布特征,计算新出生的一群人预期平均存活的时间。本研究分析的美国50州人均预期寿命数据,来自凯撒家庭基金会(Kaiser Family Foundation)在美国州水平健康统计中提供的2010年各州人均预期寿命数据。该数据以年为单位,数值越大,代表人均预期寿命越长。例如,该数据提供的美国2010年全国的人均预期寿命是78.9岁,亚拉巴马州是75.4岁。

(四)死亡率

死亡率数据来自美国疾病控制与预防中心发布的《死亡:2013 年最终数据》(Centers for Disease Control and Prevention,2013)。该数据包含了美国各州在统计期内的总体死亡率以及各种死因数据。各种死因的分类是主要依据《国际疾病分类(第十版)》( International Classification of Diseases Tenth Revision ,ICD-10)。其中,艾滋病数据缺失值较多,因而未纳入本书的分析。本书中所有死亡率数据均取经年龄校正后的数据,具体指标和数据介绍如下:

(1)总死亡率(Death Rates of all Causes):本书中分析美国50州总体死亡率,为经过年龄调整后的每十万人中死亡的人数。其中,人口是根据人口普查局提供的各州人口数。根据该数据集,美国2013年全国的总死亡率为731.9每十万人。为了进行跨州对比,以下各类死亡率数据中,数值均表示每十万人中死亡的人数。

(2)恶性肿瘤(Malignant Neoplasms)死亡率:指各州每十万人中因恶性肿瘤疾病死亡的人数。美国全国的恶性肿瘤死亡率为163.2。

(3)糖尿病(Diabetes Mellitus)死亡率:指各州每十万人中因糖尿病死亡的人数。美国全国的糖尿病死亡率为21.2。

(4)帕金森症(Parkinson's Disease)死亡率:指各州每十万人中因帕金森症死亡的人数。美国全国的帕金森症死亡率为7.3。

(5)阿尔茨海默症(Alzheimer's Disease)死亡率:指各州每十万人中因阿尔茨海默症死亡的人数。美国全国的阿尔茨海默症死亡率为23.5。

(6)心脏病(Diseases of Heart)死亡率:指各州每十万人中因心脏病死亡的人数。美国全国的心脏病死亡率为169.8。

(7)原发性高血压与高血压肾病(Essential Hypertension and Hypertensive Renal Disease)死亡率:指各州每十万人中因原发性高血压与高血压肾病死亡的人数。美国全国的原发性高血压与高血压肾病死亡率为8.5。简称高血压死亡率。

(8)脑血管病(Cerebrovascular Diseases)死亡率:指各州每十万人中因脑血管病死亡的人数。美国全国的脑血管病死亡率为36.2。

(9)流感和肺炎(Influenza and Pneumonia)死亡率:指各州每十万人中因流感和肺炎死亡的人数。美国全国的流感和肺炎死亡率为15.9。简称流感类死亡率。

(10)慢性下呼吸道疾病(Chronic Lower-Respiratory Diseases)死亡率:指各州每十万人中因慢性下呼吸道疾病死亡的人数。美国全国的慢性下呼吸道疾病死亡率为42.1。简称慢下呼吸道死亡率。

(11)慢性肝病和肝硬化(Chronic Liver Disease and Cirrhosis)死亡率:指各州每十万人中因慢性肝病和肝硬化死亡的人数。美国全国的慢性肝病和肝硬化死亡率为10.2。简称肝病死亡率。

(12)肾炎、肾病综合征、肾病(Nephritis,Nephrotic Syndrome and Nephrosis)死亡率:指各州每十万人中因肾炎、肾病综合征、肾病死亡的人数。美国全国的肾病死亡率为13.2。简称肾病死亡率。

(13)意外事故(Accidents)死亡率:即事故导致死亡率,指各州每十万人中因意外事故死亡的人数。美国全国的意外事故死亡率为39.4。

(14)机动车事故(Motor Vehicle Accidents)死亡率:指各州每十万人中因机动车事故死亡的人数。美国全国的机动车事故死亡率为10.9。

(15)故意自我伤害(Intentional Self-Harm)死亡率:即自杀死亡率,指各州每十万人中因自杀死亡的人数。美国全国的自杀死亡率为12.6。

(16)凶杀(Assault or Homicide)死亡率:指各州每十万人中因凶杀死亡的人数。美国全国的凶杀死亡率为5.2,其中,北达科他州和维蒙特州的凶杀死亡率因数据信度或精度问题而缺失。

(17)酒精导致(Alcohol-Induced Causes)死亡率:指各州每十万人中酒精导致死亡的人数。美国全国酒精导致死亡率为8.2。

(18)药物导致(Drug-Induced Causes)死亡率:指各州每十万人中药物导致死亡的人数。美国全国药物导致死亡率为14.6。

(19)枪支伤害导致(Injury by Firearms)死亡率:指各州每十万人中枪支伤害导致死亡的人数。美国全国枪支伤害导致死亡率为10.4。简称枪支导致死亡率。

(五)心理疾病

心理疾病的数据来自《2012—2013全国药物使用和健康调查:基于模型的流行率估计》报告(National Survey on Drug Use and Health,NSDUH,2013)。该调查报告使用的数据,主要来源于2012 年和2013 年的物质滥用和心理健康服务管理局(Substance Abuse and Mental Health Services Administration,SAMHSA)、行为健康统计和质量中心(Center for Behavioral Health Statistics and Quality)、“全国药物使用和健康调查(National Survey on Drug Use and Health)”等的数据。报告中关于州水平数据的估计值,是通过调查加权的分层贝叶斯估计法和马尔可夫链蒙特卡罗技术得到(National Survey on Drug Use and Health,2013)。本研究中进行分析的各指标,均为各州成年人(18 岁以上)群体的人口比例(百分比),数值越大表示心理疾病问题越严重。

(1)酒精依赖症(Alcohol Dependence)率:指过去一年中,存在酒精依赖症的人口比例。其中,酒精依赖症是依据《精神障碍诊断与统计手册(第四版)》(4 th Edition of the Diagnostic and Statistical Manual of Mental Disorders ,DSM-IV)进行定义的。

(2)非法药品依赖或滥用(Illicit Drug Dependence or Abuse)率:指过去一年中,非法药品依赖或滥用症的人口比例。其中,非法药品主要指大麻、可卡因(包括裂纹)、海洛因、致幻剂、吸入剂,或非医疗用的精神类处方药;非法药品依赖或滥用率是根据《精神障碍诊断与统计手册(第四版)》进行定义的。简称非法药品依赖率。

(3)严重心理疾病(Serious Mental Illness)率:指过去一年中,有严重心理疾病的人口比例。根据DSM-IV轴I障碍用临床定式检查指南,严重心理疾病是指有可诊断的心理、行为或情绪障碍。这里统计的严重心理疾病也包括被诊断为造成严重功能性损伤的个体。

(4)任何心理疾病(Any Mental Illness)率:指过去一年中,有任意一种心理障碍的人口比例。根据DSM-IV轴I障碍用临床定式检查指南,任何心理疾病被界定为有可诊断的心理、行为或情绪障碍。

(5)强自杀念头(Serious Thoughts of Suicide)率:指过去一年中,有强烈的自杀想法的人口比例。

(6)抑郁症(Depressive Episode)率:指过去一年中,至少有一种主要的抑郁症状的人口比例。根据DSM-IV的标准,抑郁症是指个体体验到一种抑郁情绪或者在日常活动中丧失兴趣或快乐,拥有至少一种主要的抑郁症状,并且上述状态持续了2周以上的时间。

(六)物质滥用和健康行为

物质滥用和健康行为的数据来自《2012—2013 全国药物使用和健康调查:基于模型的流行率估计》报告。本研究的分析数据为美国各州18岁以上成年样本的调查数据结果,数值为代表各州居民在以下物质滥用和药品使用指标上百分比越大,物质滥用和药品使用问题越严重。

(1)非法药品使用(Illicit Drug Use)率:指过去一个月中,使用非法药品的人口比例。非法药品的定义同上。

(2)大麻使用(Marijuana Use)率:指过去一年中,使用大麻的人口比例。

(3)可卡因使用(Cocaine Use)率:指过去一年中,使用可卡因的人口比例。

(4)止痛药滥用(Nonmedical Use of Pain Relievers)率:指过去一年中,滥用非医疗使用的止痛药的人口比例。

(5)过度饮酒(Binge Alcohol Use)率:指过去一个月中,饮酒过度的人口比例。饮酒过度被定义为:在过去30 天里,至少出现过一次,在同一场合下(例如,同时或在几个小时内)喝酒达5杯及5杯以上的情况。

(6)烟草使用(Tabacoo Product Use)率:指在过去的一个月中,使用烟草相关产品的人口比例。其中,烟草产品包括香烟、无烟烟草(即咀嚼烟草和鼻烟)、雪茄或烟斗。

(7)吸烟(Cigarette Use)率:指过去一个月中,吸烟的人口比例。

三、控制变量指标

已有关于区域水平的研究发现,州水平的教育、收入、种族、性别、城市化程度等变量对于很多重要的区域差异都有重要的影响作用(例如,Axelrod,1986),因此区域水平研究中需要对这些变量进行控制,从而排除它们对研究问题的干扰(Rentfrow,2010)。本研究分别搜集了2012—2013 年间美国50 州在教育程度、收入水平等方面的数据作为控制变量。

(1)教育程度:本研究的教育程度数据来自“美国社区调查(American Community Survey)”中关于“25岁以上拥有高中及以上学历的人口比例”“25岁以上拥有大学及以上学历的人口比例”两个指标在2012—2013 年的数据(American Community Survey,2012,2013)。本研究参考McCann(2011)关于教育程度相关的指标处理办法:首先分别对来自2012 年和2013 年的两个教育程度变量进行标准化,然后取这四个变量平均值,最后合成一个综合的教育程度指数。该指数具有较高的内部一致性信度,克隆巴赫系数(Cronbach's α ,即信度系数)达到0.931。

(2)收入水平:本研究采用州水平的人均GDP、人均收入、家庭收入中值(Median Household Income)来衡量收入水平。其中,人均GDP、人均收入均来自美国商务部经济分析局(Bureau of Economic Analysis,U.S. Department of Commerce)的区域经济统计数据(Regional Economic Accounts),家庭收入中值数据来自美国人口普查局(U.S. Census Bureau)。将2012 年、2013 年的人均GDP、人均收入以及家庭收入中值分别标准化,然后求其均值,得到最终的收入综合指数。在构建收入综合指数的过程中,各收入分指标有非常高的稳健性,信度系数达到0.966。

(3)女性人口比例:女性人口比例数据来自美国人口普查局关于2012 年、2013年女性人口的估计数据(U.S. Census:Population Estimates,2013)。将各州2012年、2013年的女性人口比例数据分别标准化,并取均值得到各州女性人口比例指标。两个指标的信度系数达到0.999。

(4)白人人口比例:白人人口比例数据来自美国人口普查局关于2012 年、2013年白人人口的估计数据(U.S. Census:Population Estimates,2013)。将各州2012年、2013年的白人人口比例数据分别标准化,并取均值得到各州白人人口比例指标。两年白人人口比例高度相关,相关系数约等于1。

(5)城市人口比例:各州城市人口占总人口比例,反映的是各州城市化水平。本研究中城市人口比例数据取自美国人口普查局提供的2010年人口普查数据(U.S. Census Bureau,2013)。 Zr7wf/QVgfwmb1QuMOgWoKC7EJw6/zID2hSASqvPv4AM6rcYjyN+yCaa8z3hyVHB

点击中间区域
呼出菜单
上一章
目录
下一章
×