统计工作的基本步骤可概括为统计设计、搜集资料、整理资料、分析资料和结果表达等几个环节,其中任一环节发生缺陷,都会影响研究结果的质量,甚至有可能导致错误的结论。
统计设计(statistical design)就是指如何合理地确定总体与样本、样本量及抽样方法,估计抽样误差的大小,如何对研究结果进行有效地统计分析。其目的在于保证结果的经济性、重复性、可靠性和科学性。无论是调查设计还是实验设计,均涉及专业设计与统计设计;一个严谨的研究设计,必然是专业知识与统计技术的完美结合。
著名统计学家Fisher指出,统计设计应该遵循随机、对照、重复、均衡和盲法等五项基本原则,以确保研究结果与结论的科学性。
搜集资料(data collection)是指根据研究目的,按照设计要求去搜集原始资料。搜集资料的过程实际上是具体调查或实验实施的过程,必须坚持科学的态度和实事求是的精神,原始资料的完整、准确和及时性,是正确做出统计结论的前提与基础。卫生统计的资料来源主要有日常医疗卫生工作记录和报告单、统计报表、专题调查、实验或试验研究资料、公共或共享的其他资料等。
整理资料(sorting data)是把搜集到的原始资料,有目的、有计划地进行科学地加工整理,使其系统化、条理化,以便更好地揭示所研究事物的规律性,便于统计分析。整理资料的过程包括资料审核、分组、拟整理表和归纳汇总等。
分析资料(analysis data)就是根据资料类型、设计方法和分析目的等因素,选择合适的分析方法,对资料进行计算分析。主要包括统计描述与统计推断两个方面。
统计计算的结果一般通过选择适当的图表与统计指标来表达,再根据统计指标在一定的概率基础上做出统计结论。信息时代,统计设计、数据库的建立与管理、统计分析的大多数任务需要由统计软件来协助完成,而正确领悟统计思想以及统计软件所输出的计算结果,并在研究报告和论文中作出适当的解释与表达显得越来越重要。统计学是一门科学,也是一门艺术,其艺术性主要通过结果与结论的表达来体现。
在卫生服务的实践与研究中,人们常常需要借助于一些统计软件来实现统计设计和统计分析功能,本书主要应用SPSS(statistical product and service solutions)统计软件来实现。SPSS是世界上最早的统计分析软件之一,原意为“社会科学统计软件包”(statistical package for the social sciences),由美国斯坦福大学的三位研究生Norman H.Nie,C.Hadlai(Tex)Hull和Dale H.Bent于1968年研究开发,并成立了SPSS公司,随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年正式将全称更改为“统计产品与服务解决方案”(statistical product and service solutions),标志着SPSS的战略方向正在做出重大调整,2009年更名为“预测统计分析软件”(predictive analytics software,PASW),2009年10月,IBM公司完成收购,2010年更名为IBM SPSS,2022年IBM SPSS发布了最新版本29.0,SPSS是目前全球最为广泛应用的统计软件之一。