城市群公共服务协同供给研究最新章节_李晓梅著

第三节
数据采集和数据分析

一数据采集

（一）网络检索爬取数据

本书描述和分析城市群公共服务协同供给情况的基础数据来源于爬虫软件网络检索。以“成渝”“川渝”“公共服务”等为关键词，选择四川省人民政府网站和重庆市人民政府网站两个窗口，采用爬虫软件进行检索，甄选出截至2021年7月30日官方网站发布的相关新闻报道、公开信息和政策文件等资料共计1204份。为保证研究样本的完整性、全面性以及研究主体契合性，在对采集资料进行交叉去核和去重后，按照相关性原则和独立性原则，通过逐份阅读对文本资料进行筛选和梳理，最终选出346份相关文本资料作为成渝双城经济圈公共服务协同供给状况的典型样本与分析资料。

城市群内部地方政府之间合作关系的形成和合作模式主要通过合作协议来体现和推动，如各种合作框架协议、合作宣言、合作意见等，合作协议即代表了特定的关系资源配置，依托合作协议构建的合作关系能够促进信息和机会的互惠，降低机会主义风险，形成一系列彼此包容的偏好（Shapiro et al.，1992；Jones et al.，1997），为合作的地方政府提供社会收益。此类协议既包括有行政隶属关系的上下级政府间的纵向协议，也包括同级别地方政府之间或地方政府部门之间的横向协议，还可以是级别不同、互不统辖的地方政府或部门之间的斜向协议。因此，本书主要通过对地方政府间合作协议作为基本分析资料。

成渝地区双城经济圈这一区域概念是2020年1月中央财经委员会第六次会议首次提出，同年10月中共中央政治局召开会议，审议了《成渝地区双城经济圈建设规划纲要》，这是中央对西部地区发展规律和战略规划的进一步明确和聚焦。此前主要使用的是“成渝经济区”（2011年）和“成渝地区双城经济圈”（2015年）的区域概念。因此，我们收集资料时，采集了“成渝经济区”和“成渝地区双城经济圈”议题相关资料信息，预览其政策内容并进行甄别，最终形成具体可用的资料数据库。

（二）政策文本数据采集

本书梳理我国城市群发展变迁特征和趋势，所使用的政策文本来源于中国政府网站，在“政策文件库”这一子栏目，以“城市群”为关键词，搜索并整理获得与城市群相关的政策文件，其中国务院发布的政策84份，国家相关部委发布的政策42份，共计126份。

本书梳理成渝地区双城经济圈合作政策演进和合作管理，资料主要来源于国务院网站、四川省人民政府网站、重庆市人民政府网站、各地方政府门户网站、人民网、北大法宝数据库和各地方政府发布的政策文件，经过核对筛选和清洗，共获得有效信息约105条。

（三）统计数据收集

本书以成渝地区双城经济圈为案例进行论证分析，对于成渝地区双城经济圈行政区划概况、经济产业状况、人口流动分布的数据来源于2010年至2020年《四川统计年鉴》和《重庆统计年鉴》。成渝地区双城经济圈内各地方政府公共服务水平、公共服务供给能力和公共服务治理差异测度的基础数据来源于2010年至2020年相应区域统计年鉴或统计公报。

二数据分析

（一）文本分析法

文本分析法是一种对文本进行由浅入深的比较、分析、综合、提炼，是一种定性和定量相结合的内容分析方法，最初应用于情报学和信息科学，逐渐发展成为现代社会科学领域的重要研究方法（文宏，2014）。文本分析法可以将质化数据进行量化，运用统计学理论及方法对分析单元出现的频数进行计量，运用数字或者图表的方式表达文本分析结果，用于揭示政策的演变历程、重点议题以及政策过程的主体合作网络等公共政策研究问题（黄萃、任弢、张剑，2015）。

成渝双城经济圈地方政府的协同治理政策文本集中体现了地方政府决策者的注意力在特定制度环境下的配置和分布，通过分析相关资料文本且将府际合作互动的各项具体行动进行编码，便能抽象出合作总体数量、结构特征与变动趋势，结合社会网络分析方法可以有侧重地剖析成渝双城经济圈地方政府在某一政策领域中合作选择的网络，反映成渝双城经济圈公共服务协同供给的基本情况。

为了更深入地了解成渝双城经济圈公共服务领域协同供给的现实状况，我们首先借助质性分析软件NVivo对收集到的政策文本信息进行编码与分析。政策文本内容通常会反映决策者对事物的价值判断及认知情形，可以借助NVivo软件对特定词汇或者句子出现的频数或频率来测量决策者注意力的配置，往往出现的频数或频率越大，表明决策者对其关注度越高。因此，本章采用NVivo11版本为工具对成渝双城经济圈地方政府合作协议等文本资料进行分析，可以更加便捷地对现有资料进行汇编，掌握公共服务领域成渝双城经济圈地方政府之间的协同侧重点及结构关系，便于后续评估协同治理效果。

根据研究主题预设编码节点，形成研究框架，对文本进行编码和分析。为保持数据的完整性，防止主要信息的遗漏，本书对研究文本采用逐行编码的方法，以句子作为最小单位将文本资料进行划分。对79份成渝双城经济圈协同供给文本资料逐句进行阅读，经过同类属性编码的不断合并与归纳最终形成了6个树节点，39个子节点，参考点数值为986项，参考点为每个节点的编码频次，代表每个节点在原始文本资料中出现的次数，编码次数越多则代表地方政府的注意力配置越多。节点层次与参考点信息如表1-2所示。

表1-2 节点层次及参考点信息汇总

续表

此外，为便于后续交叉分析梳理成渝双城经济圈协同特征，将采集到的79份文本资料进行分类，在NVivo软件中赋予每一份文本特定的属性特征，总共划分了时间趋势、协同结构以及行政等级3个类属，其中时间趋势代表资料指向的成渝双城经济圈协同事件发生的具体时间点；协同结构分为双边和多边两个属性，若资料中的协同合作行为发生在两个城市之间，则为双边，如若涉及多个城市间的协同合作，则归为多边；行政等级则代表不同行政级别城市间的协同合作，按照资料中的具体内容总共划分为了6个类属。资料来源的详细分类及赋值情况如表1-3所示。

表1-3 资料来源属性分类信息汇总

为保证质性研究的信度与效度，研究者需要对文本资料进行独立编码，进一步探讨、修正每一个编码内容直至排查歧义编码项，并介入独立第三人进行审核排查。NVivo中可以通过“编码比较查询”功能，通过比较不同研究者针对同样的文本资料所得出的编码，以衡量编码的可靠性。

通过邀请另一位编码人员对现有的文本资料进行编码，通过在编码比较查询中标记需要比较的节点，分别将两组编码人员的内容分配至A/B组中进行比对，发现两份编码的一致率均在88%以上，且Kappa系数均在0.73—1。譬如随机选取协同内容树节点下的两组子节点编码：基础教育和医疗卫生，发现基础教育的Kappa系数为0.95，百分比同意度为96.3%，而医疗卫生的Kappa系数是0.98，百分比同意度为98.1%，说明编码具有较高可信度。

（二）社会网络分析法

社会网络分析法是20世纪60年代以来社会学大师怀特及其后继者伯曼、布里格和弗里曼等人，由数学中图形理论推导出来的一套数学分析方法。它能清晰地观察社会网络中行为主体之间的互动关系及其合作网络的结构特征，从而有效地对社会网络进行测量，通过研究网络中节点间关系，进而构建社会行动者之间的互动结构和确定行动者属性，以此发现个体在网络中所处的角色，或者网络的特征。发展至今，社会网络分析方法已经渗透到了公共管理学研究，有相当一部分学者将研究锁定在了城市间的合作关系，尤其是通过府际合作达成的区域网络关系，如危机事件中的合作关系、公共服务中的合作关系、公共资源治理中的合作关系等。

为了更深入地了解成渝双城经济圈公共服务领域协同供给网络状况，在质性分析软件NVivo对政策文本信息编码的基础上，采用社会网络分析软件Ucinet分析协同网络特征。Ucinet网络分析集成软件包括一维与二维数据分析Net Draw，还有正在发展应用的三维展示分析软件Mage等，可用于描述整个网络和网络中节点的位置，以及绘制网络结构图。本书运用 Ucinet 6版本软件对成渝双城经济圈公共服务协同供给状况进行社会网络分析，测量网络密度、网络的度数中心度、中间中心度、接近中心度等，并且通过凝聚子群、核心—边缘结构分析和Ucinet加载的Net Draw绘图工具描绘成渝双城经济圈各地方政府间可视化的协作网络，测算公共服务领域协同水平及互动程度。

（三）统计模型分析法

本书最终回答的问题是我国城市群公共服务府际合作差异的主要影响因素是什么？我国城市群公共服务府际合作差异的形成机制是什么？基于研究目的和数据特征，采用更适用的负二项回归模型进行数据分析，并验证了主效应和调节效应。在泊松回归模型的基础上对负二项回归模型进行改进，在其条件均值中引入一个随机效应，在实际应用中可以有效解决计数数据的“过度分散”问题，提高估计效率。由于本书中不同城市间的公共服务合作协议和合作行动频次差异较大，且较多城市之间尚未形成合作协议或合作行动，存在数据“过度分散”的可能性。基于本书数据的Vuong统计量检验结果表明应使用标准负二项回归统计模型进行因果分析。

第三节 数据采集和数据分析

一 数据采集