统计就是人们正确运用统计理论和方法收集数据、整理数据、分析数据和由数据得结论的实际操作过程,是人们通过数据对客观世界的一种认识活动。现代统计的含义包括三个方面:统计工作(统计活动)、统计资料和统计学。统计是统计工作、统计资料和统计学的统一体。
统计工作即统计实践,是对社会经济现象客观存在的现实数量进行收集、整理和分析预测等活动的总称。一个完整的统计工作过程一般包括统计设计、统计调查、统计整理、统计分析等环节。统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。例如,银行的计划统计科,每月编制项目报表,这个过程就是统计工作;又如,我国进行人口普查时要经过方案设计、入户登记、数据汇总、分析总结和资料公布等一系列过程。这些都是统计工作。在我国、各级政府机构基本上都有统计部门,如统计局,它们的职能主要就是从事统计数据的收集、整理和分析工作。
统计资料是统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。
统计资料统计提供数据信息的基本表现形式,是统计工作的直接成果。统计资料包括原始资料和整理后的资料即次级资料。例如,企业生产经营活动的原始记录、各车间的统计台账、人口普查时初次登记的资料就是原始资料,而统计公报、调查分析报告等现实和历史资料就是次级资料。统计资料的表现形式有统计表、统计图、统计分析报告、统计公报和统计年鉴等。
统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。统计学经过 300 多年的发展,形成了自己的学科体系。统计学从统计分析方法的研究和应用角度,分为理论统计学和应用统计学,前者研究一般的收集、整理和分析数据的方法,后者则以各个不同领域的具体数量为研究重心。
1.描述统计学(descriptive statistics)
描述统计学研究如何取得反映客观现象的数据,并以图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征,内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
2.推断统计学(inferential statistics)
推断统计学研究如何根据样本数据断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。其中,应用纯逻辑推理的方法研究抽象的随机现象的数量规律性的科学称为理论统计学,而应用统计方法研究各领域客观现象的数量规律性的科学称为应用统计学。社会经济统计学则是关于国民经济和社会现象数量方面的调查、整理和分析的原理、原则和方式方法的科学,按性质它属于应用统计学。
统计工作、统计资料和统计学三者之间的关系为:统计工作是搜集统计资料的过程,统计资料是统计工作的结果,统计学是统计工作的经验总结和概括,统计学反过来又指导统计工作。统计学是从数据方面认识客观世界,研究社会经济现象的。在统计学中运用到大量的数学知识,数学为统计理论和统计方法的发展提供基础,但是不能将统计学等同于数学。统计学以被用到几乎所有的研究领域,可以帮助其他学科探索学科内在的数量规律性,但是统计学并不能解决各学科领域的所有问题,对统计分析结果的解释以及对各学科内在规律的研究,还需要各学科领域的专业研究来完成。
统计数据的收集是取得统计数据的过程,是进行统计分析的基础。如何取得准确、可靠的统计数据是统计学研究的内容之一。
统计数据的整理是统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据整理是数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,是通过统计描述和统计推断的方法来探索数据内在规律的过程。
可见,统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系。
英文中, statistics一词有两个含义:当它以单数名词出现时,表示作为一门科学的“统计学”;当它以复数名词出现时,表示“统计数据”或“统计资料”。从中可以看出,统计学由一套收集和处理统计数据的方法组成,这些方法来源于对统计数据的研究,目的也在于对统计数据进行研究。离开了统计数据,统计方法就没有了用武之地,统计学也就失去了存在的意义。而统计数据如果不用统计方法加以分析也仅仅是一堆数据而已,得不出任何有益的结论。
此外,统计数据在英文中是以复数形式出现的,这表明统计数据不是指单个的数字,而是由多个数据构成的数据集。单个的数据显然不需要用统计方法进行分析,仅凭一个数据点也不可能得出事物的规律,只有经过对同一事物进行多次观察或计量得到大量数据,才能利用统计方法探索出事物内在的必然规律性。
统计学和统计活动是理论与实践的关系,它们的研究对象是一致的。统计的研究对象是大量现象总体的数量方面,其特征是在质与量的辩证统一中研究大量现象总体的数量方面,反映现象发展变化的规律性在具体时间、地点和条件下的数量表现,揭示事物的本质相互联系、变动规律性和发展趋势。统计学和统计活动的区别在于:统计学是从理论角度进行研究阐述,统计活动则是从实践角度进行具体研究。
数量方面是指现象总体的数量特征、数量关系及数量界限,通过对这些数量方面的研究,表明所研究现象的规模、水平、速度、比例和效益等,以反映社会经济现象发展变化的规律性,反映现象的本质。统计学和统计工作是理论和实践的关系,它们所要认识的研究对象是一致的。
社会经济现象包括自然现象以外的社会的政治、经济、文化、人民生活等领域的各种现象。比如,国民财富与资产、人口与劳动力资源、生产与消费、财政与金融、教育与科技发展状况、城乡人民物质文化生活水平等。通过对这些基本的社会经济现象的数量方面的认识,达到对整个社会的基本认识。
社会经济统计学虽然不研究自然现象与科学技术本身,但是社会、经济和自然、技术总是密切联系、相互影响的。社会经济统计学也研究自然技术因素对社会生活变化的影响,研究社会生产发展对社会生活自然条件的影响。例如,研究资源条件和技术条件的变化对于社会生产生活的影响程度,研究社会生产的发展引起自然条件的变化等。
【例 1-1】我国历次人口普查的总人口情况见表 1-1。
表 1-1 我国历次人口普查的总人口情况
数据来源:根据国家统计局历次人口普查统计公报数据整理而来。
1.数量性
从数量上认识现象的性质和规律性,这是统计研究的基本特点。
统计的研究对象是社会经济现象的数量方面,包括社会经济现象的规模、水平、现象间的数量关系,以及决定现象质量的数量界限。统计研究对象的数量性,是统计区别于他社会经济调查研究活动的根本特点。统计对社会经济现象数量方面的认识是定量认识但必须以定性认识为基础,要和定性认识结合起来,遵循定性-定量-定性的科学的认规律。现象的数量方面包括数量多少、数量关系、质和量互变的数量界限等。数量关系指各种平衡关系、比例关系和依存关系,例如总供给与总需求的平衡关系,各产业间的比例关系,消费与收入之间的依存关系等。客观现象往往具有复杂性的特点,现象之间具有多方面的联系。
2.总体性
统计研究的对象总是由大量同类事物构成的总体现象的数量特征。个别和单个事物的数量表现是可以直接获取的,一般无需运用统计研究方法。例如,要了解某名工人的工作情况,查一查生产记录就可以了,可如果要了解全体工人产量的分布、差异和一般水平等,就要用统计方法来进行计算和分析。统计对总体现象的数量特征进行研究时,是通过对组成总体的个别事物量的认识来实现的。例如,在人口普查中,我们通过对每一户家庭的人口状况进行调查,根据所取得的资料,编制人口总数,人口结构(性别、年龄、民族、职业等结构),人口分布,人口出生率,人口死亡率等指标来反映一个国家或一个地区的人口总体情况。个别事物有很大的偶然性,大量事物具有共性。统计学正是要从大量的客观事物中找出其共性,即规律性,从对个体数量特征的观测入手,运用科学的统计方法获得反映总体一般特征的综合数量,这是统计的又一基本特征。
3.变异性
变异性是指组成研究对象的各个单位在特征表现上存在差异,并且这些差异是不可以按已知条件事先推断的。例如,要研究某地区的消费行为,每个消费者的家庭收入有差异,消费偏好有差异,消费品的市场价格也不稳定。这时就需要研究消费者平均消费、家庭平均收入、消费偏好和消费品的市场价格等因素。正是因为研究对象的各单位存在差异性,统计方法才有了用武之地。
4.社会性
统计学通过研究大量社会经济现象总体的数量方面,来认识人类社会活动的条件、过程和结果,反映物质资料的占有关系、分配关系、交换关系以及其他的社会关系。其定量研究是以定性分析为前提的,而定性分析使其在客观上就有了社会关系的内涵。社会经济现象与自然科学技术问题是不同的,对于同一社会经济现象,站在不同的立场,持有不同的观点,运用不同的方法,可以得出差别较大的结论。这些都体现出社会经济统计活动的社会性。
5.具体性
统计研究的总体数量是一个有具体时间、具体地点、具体条件限定的数量。如销售收入 100 万元,在表面上看,它只是一个毫无意义的抽象数量。如果说 2023 年 5 月份某企业销售收入为 100 万元,这就是统计中所说的具体数量了。可见具体性就是指在时间、地点、条件三方面有着明确的规定性。
统计工作虽然是研究具体的数量,但为了进行复杂的定量分析,还需要借助抽象的数学模型和数理统计方法,遵循一定的数学规则。以抽象方法为手段,以具体数量为目的,体现了统计研究中具体和抽象的辩证关系。
人们在统计实践经验的基础上,通过逐步概括和总结,形成了一系列专门的统计方法,构成了统计方法体系,如图 1-2 所示。
图 1-2 统计方法体系
大量观察法是统计活动中收集数据资料的基本方法,该方法是指统计研究客观现象和过程,要从总体上进行考察,对总体中的全部单位或足够多的单位进行调查并加以综合研究。统计研究运用大量观察法是由社会经济现象的大量性和复杂性所决定的。统计调查中的许多方法,如统计报表、普查、抽样调查等,都是通过观察研究对象的大量单位,来了解客观事物及其发展规律的。复杂的社会经济现象是在诸多因素的错综作用下形成的,各单位的数量特征有很大差别,不能仅取少数单位或任意抽取个别单位进行观察,必须从总体出发,收集大量调查单位的材料,才能从中认识社会经济现象的规律性。只有对足够多数的个体进行观察,观察值的综合结果才会趋向稳定,建立在大量观察法基础上的数据资料才会给出一般的饥困。统计学的各种调查方法都属于大量观察法。
由于研究对象本身的复杂性、差异性及多层次性,需要对研究现象进行分组或分类研究,以期在同质的基础上探求不同组或类之间的差异性。统计分组法是指根据统计研究的任务和现象本身的性质特点,按照某种标志将总体区分为若干组成部分的一种统计方法。例如,将人口按性别分组、职工按职业分组、学生按成绩分组、企业按经济类型分组、公司按经营收入分组等。
统计分组法是研究社会经济现象总体内部差异的重要方法,统计分组法在统计研究中的应用非常广泛。统计分组法有传统分组法、判别分析法和聚类分析法等。
综合指标是指综合反映社会经济现象总体数量特征和数量关系的指标。常用的综合指标有总量指标、相对指标、平均指标和标志变异指标等。综合指标法在统计学,尤其是社会经济统计学中占有十分重要的地位,是描述统计学的核心内容。综合指标法运用各种统计综合指标对社会经济现象的数量方面进行综合、概括的分析。通过对大量的原始数据进行汇总整理,计算出各种综合指标,可以反映出现象在具体时间、地点、条件下的总体规模、相对水平、平均水平和差异程度,概括地描述总体的综合数量特征及其变动趋势。
综合指标法和统计分组法之间存在着密切的关系。统计分组如果没有相应的统计指标来反映现象的规模水平,就不能揭示现象总体的数量特征,而综合指标如果不进行科学的统计分组,就无法划分事物变化的数量界限,就会掩盖现象的矛盾,成为笼统的指标。所以,在研究社会经济现象的数量关系时,必须科学地进行分组,合理地设置统计指标,指标体系和分组体系应该相适应。一般应把统计分组和综合指标结合起来进行应用。
归纳推断法是指对所获得的大量观察资料,通过观察各单位的特征,归纳推断总体特征的方法。一般以一定的置信度要求,采用归纳推理方法,根据样本数据来推断总体数量特征。这是从个别到一般,由具体事实到抽象概括的推理方法。归纳推断法可用于总体数量特征的估计,也可用于对总体的某些假设进行检验,在统计研究中有广泛的用途,是现代统计学的基本方法之一。
统计模型法是根据一定的经济理论和假定条件,用数学方法模拟客观经济现象相互关系的一种研究方法。统计模型法一般必须包含三个方面的构成要素,即社会经济变量、基本数学关系式和模型参数。在进行实际计算与分析时,一般将总体中一组相互联系的统计指标作为社会经济变量,其中有些变量会被描述为其他变量的函数,可称为因变量,而它们所依存的其他变量则称为自变量,往往要用一个或一组数学方程式来表示现象的基本关系式,该数学方程可以是直线的,也可以是曲线的,可以是二维的,也可以是多维的。利用这种方法可以对社会经济现象和过程中表现出来的数量关系进行比较完整和近似的描述,从中将客观现象的其他复杂关系影响加以抽象和抵消,以便于利用数学模型对社会经济现象的变化进行数量上的模拟和预测,如长期趋势分析、相关回归分析、统计预测等。统计模型法是贯穿统计认识全过程的基本方法,也是统计分析的最普遍、最严密的方法。现代信息技术的迅猛发展,为其应用开辟了更加广阔的领域。上述各种方法之间是相互联系、互相配合的,共同构成了统计学的方法体系。