统计工作是对社会经济现象总体数量进行的一种调查研究活动,也是对事物的表面、本质及其规律性的认识活动。这一活动是一个由浅入深的过程,这个过程可以概括为统计设计、统计调查、统计整理、统计分析四个阶段。
统计设计是统计工作的第一个阶段,它是指根据统计研究对象的性质和研究目的,对统计工作的各个环节和各个方面进行统筹安排。统计设计的结果表现为各种统计设计方案,如统计指标与统计指标体系、分类目录、统计报表制度、调查方案、汇总或整理方案等。
统计设计包括对统计活动的全过程设计和单项设计两个方面。全过程设计是指针对一项统计研究任务,对收集、整理、分析数据工作的全过程所做的设计。单项设计是指对收集、整理、分析数据的某一个环节所做的进一步的设计。对统计活动各个方面的设计,主要是指统计研究对象的各个组成部分,它们是统计工作横向的方面。例如,工业企业统计包括工业企业经营的内部条件和外部条件,人力、物资、资金等生产要素,生产、供应、销售等生产经营环节。再如,整个社会经济统计包括人口、环境、资源等社会发展的环境条件,物质资料的生产、分配、流通、消费的扩大再生产过程,政治、文化、教育、科学、卫生、体育等社会活动,人民的物质和文化生活状况,国际以及其他各国的经济和社会状况。
对统计各个环节的设计,主要是指统计工作实际进行时的各个阶段,它们是统计工作纵向的方面。这些阶段包括统计数据的收集,统计数据的汇总整理,统计分析,统计数据的提供、保存、公布,等等。
统计调查也称数据收集,它是统计工作过程的第二个阶段。统计调查是根据统计研究对象和研究目的的要求,采用科学的调查方法,有组织、有计划地向客观实际收集统计数据的工作过程。统计调查的方法主要有统计报表制度、普查、抽样调查、重点调查、典型调查等。这一阶段是统计实践活动的开始,属于表层和感性认识阶段。但因为统计是要用数字说话的,而统计数字来源于统计调查,因此,“没有调查就没有发言权”。统计调查属于定量认识阶段,它的工作质量如何,直接关系并影响到以后各阶段的工作质量。
统计整理是按照一定的目的和要求,对统计调查收集到的大量零乱资料进行科学的加工和分类,使之系统化、条理化,成为能够说明总体特征的综合资料的工作过程。统计调查阶段收集的资料既丰富又零乱,既大量又粗糙。因此,需要统计整理去粗取精、去伪存真,使大量丰富的资料条理化、系统化。这一阶段是对事物由表层认识到深层认识的连接点,对统计分析的质量有举足轻重的作用,是一个承上启下的中间环节。
统计分析是在统计整理的基础上,对统计数据进行多种多样的定量和定性分析、评价和论证,由表及里、由浅入深、由此及彼,得出科学的结论,从而达到认识事物本质和规律的目的。这一阶段是认识活动上升为深层次和理性认识的研究阶段。
通过统计整理和统计分析,我们可以得到许多有用的统计数据。统计数据的提供并不意味着统计研究的终结。统计的目的在于认识客观世界的规律。对于已经公布的统计数据需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用,从而更好地将统计数据和统计方法应用于相关领域中,使统计更好地发挥信息、咨询、监督的职能。
总之,统计工作的四个阶段是一个统一体,无论哪个环节出了偏差,都会背离统计认识活动的规律,从而歪曲反映事物。统计调查出现偏差,会直接影响统计整理的质量和统计分析结果的正确性;统计分析出现偏差,会导致统计调查和统计整理两个阶段前功尽弃。统计工作各个阶段的工作质量和效果是密切相关的,因此要注意它们之间的衔接和协调。统计工作的过程框架如图1-4所示。
图1-4 统计工作的过程框架
需要指出的是,也有学者认为统计工作过程除了以上四个工作阶段以外,还包括统计预测和决策阶段、统计数据提供和保管阶段。应该说这两个方面工作的确都是统计工作的重要内容,因为整个统计工作决不能仅仅满足于对统计数字的简单加工和初步分析,统计工作的一个重要内容是要利用过去和现在的资料对现象的长期趋势做出判断和预测,并以此作为国家或企业决策的依据。
统计的基本任务是对国民经济和社会发展情况进行统计调查、统计分析,提供统计数据,实行统计监督。完成统计的基本任务,就实现了统计的基本职能,而实现了统计的基本职能,统计就发挥出了强大作用。统计的基本职能是信息职能、咨询职能和监督职能。
统计信息职能是指统计具有信息服务的功能,即统计通过系统地收集、整理和分析,得到统计数据,在统计数据的基础上再经过反复提炼筛选,得到大量有价值的、以数量描述为基本特征的统计信息,并将其服务社会。
统计咨询职能是指统计具有提供咨询建议和对策方案的服务功能,即统计部门利用所掌握的大量统计信息资源,经过进一步的分析、综合、判断,为宏观和微观决策、为科学管理提供咨询建议和对策方案。统计咨询分为有偿咨询和无偿咨询两种。统计咨询应更多地走向市场。
统计监督职能是指统计具有揭示社会经济运行中的偏差、促使社会经济运行不偏离正常轨道的功能,即统计部门以定量检查、经济监测、预警指标体系等为手段,揭示社会经济决策及其执行过程中的偏差,使社会经济决策及其执行过程按客观规律的要求进行。
统计信息职能、统计咨询职能和统计监督职能是相互联系、相辅相成的。统计信息职能是统计最基本的职能,完成统计信息职能,是实现统计咨询职能和统计监督职能的前提、基础和保证;而统计咨询职能是统计信息职能的延续和深化;统计监督职能的最终实现又是对统计信息职能、统计咨询职能的促进。总之,统计的三种功能相辅相成,相互作用,构成了一个有机整体,故又被称为整体功能。
统计学是一门应用性很强的学科。统计学为适应社会实践的发展需要而产生和发展,并随着社会的发展而不断完善,反过来,社会实践又不断丰富和发展了统计科学。统计学在认识事物、指导生产、经济管理和科学研究等各个方面都发挥着重要的作用,在大数据、人工智能、大模型构建等边缘学科中也有广泛的应用空间。统计应用得越广泛,统计的职能和作用就发挥得越充分。
1.经济分析
在当今的经济生活中,判断和认识经济形势及其未来走向,是政府、企业和家庭进行决策的基础和前提。对经济形势的分析和判断,需要掌握有关的统计信息和统计方法。例如,微观经济领域的专家需要使用统计方法为决策者提供生产、消费和定价方面的预测;宏观经济领域的专家既可以利用统计方法描述居民家庭收入分布状况,也可以对经济变量(如通货膨胀率、失业率、居民家庭平均收入水平等指标)的未来走向进行分析和预测,还可以对变量(如消费与可支配收入)之间的关系进行研究。
2.生产管理
效率及效益是以尽可能少的投入获得尽可能多的回报。要提高效率和效益,离不开科学的管理,而统计数据是管理的重要基础。例如,生产定额的制定既要使人们有可能完成,又要具有效率,那么先进的算术平均数不失为一种好方法。又如,影响产品数量和质量的因素有很多,这就要用主成分分析方法,找出主要因素、最佳水平和最佳状态,并进行科学的监督和控制。再如,在信息社会中,企业获得的信息量非常大,并且要注重情报信息的收集、处理和分析,为企业正确决策提供建设性意见。用统计方法对这些信息进行分析,就能帮助企业对事物进行定量、定性分析,从而做出正确的决策。企业市场营销部门运用统计学方法来估计顾客对某一种商品喜爱的比例,以及他们为什么喜欢这种商品,用哪种广告能让更多人知道、喜欢、购买这种商品,等等。从而增强企业竞争力,提高企业的经济效益。
3.科学研究
科学研究的任务是提示客观事物的规律性,而科学研究的方法大多是先根据若干观察或实验资料提出某种假说或猜想,然后再通过各种途径进行观察或实验加以验证,统计理论和方法就是这种科学研究的通用方法。因为统计理论和方法一方面有助于集中并提取观察和实验中的本质信息,从而有助于提供较正确的假说或猜想;另一方面,它又能指导研究人员如何安排进一步的观察和实验,以判定提出的假说或猜想是否正确。例如,在医学界,人们用统计方法来研究疾病的原因或影响因素,判断药物或医疗方案是否正确;在生物学界,人们用统计方法来研究基因分离定律、基因自由组合定律、基因稳定性定律等基因规律;在心理学界,人们用统计方法分析特定刺激的心理效应;在经济学界,人们用统计方法来研究经济运行状况,判断宏观、微观决策的正确与否,以及政策、决策的监督执行和计划的调整,等等。总之,统计学方法是科学研究领域最重要的方法。
1.大数据
统计学是以现象数据作为研究对象的。统计学研究,从初级数据到科学数据再到大数据,大体上经历了“只能收集到少量的数据—尽量多地收集数据—科学利用样本数据—综合利用各类数据—选择使用大数据”的过程,相应地在计数分析、简单运算分析、分布特征分析、估计推算分析、动态预测分析、判定分析、关联关系分析、系统平衡分析、数据挖掘分析(当然,它们之间存在着相互交叉的关系)的过程中,产生了大量观察法、统计分组法、综合指标法、归纳推断法、统计模型法和数据挖掘法等统计方法。因此,统计学与大数据之间关系密切。
大数据具有海量性、高速性、多样性、真实性等特征。
(1)海量性,从各种渠道收集的海量信息,包括商业交易数据、社交媒体数据、传感器数据以及机器对机器数据等,在过去,如何存储如此大规模的数据是一个技术难题,但新技术的快速发展减轻了存储负担。
(2)高速性,大数据以前所未有的速度产生并传播,必须及时存储与处理;电子标签、传感器、智能停车收费系统实现了实时或近乎实时处理海量数据的需求,在许多情况下,大数据可能会以聚类方式产生,即数据产生的速度并不均匀,而是随着时间的推移出现周期性波动。
(3)多样性,大数据形式多样,既有传统的结构化数字型数据,也有非结构化的文本、文档、邮件、图片、视频、音频、股票行情数据等,非结构化数据提供了传统数据所没有的丰富的新信息,这已成为大数据的一个最重要的特征,结构化数字型数据也有新型数据,如函数数据、区间数据和符号数据。
(4)真实性,与传统数据相比,大数据一般体量庞大,但很多大数据信息价值密度低,此外,也可能存在遗漏数据和操纵数据的现象,导致信息失真,因此有必要进行数据清洗与处理,而统计方法就是一种最合适的方法。
大数据拓展了边界的数据,它以能传播、存储、再现的信号为基础,除了少量常规数据外,大量的数据表现为文字、符号、代码、图像和声音,信息量很大,但从中提取信息含义的量化过程十分困难,因为缺乏统一的度量标准和测度方法。大数据时代的非结构化、半结构化数据和异构数据具有多样化、无标准的特点,难以用传统的统计指标或统计图表来表现;数据的存储载体逐步由纸质、半电子化转变为全流程电子化;数据库也从小容量转变为大容量、超大容量。总之,大数据的这些变化,为统计数据分析提供了更宽广的用武之地,也提供了更大的便利和更高的效率。
扫码观看统计与大数据
2.人工智能
统计学与人工智能之间有很多重要的联系,具体如下。
第一,人工智能需要大量的数据和数学模型来进行分析和决策,而统计学则可以帮助人工智能处理这些数据,并使用这些数据来训练机器学习模型。机器学习是一种让计算机通过学习数据来改善性能的技术。这种学习过程类似于人类的学习过程,即从经验中学习。
第二,统计学可以使用人工智能技术来提高效率和精度。例如,在数据分析中,我们可以使用机器学习算法来自动识别数据的模式和趋势。这些技术可以帮助我们更好地理解数据的含义,并指导我们做出正确的决策。在医疗领域,人工智能和统计学的应用非常广泛。例如,医生可以使用人工智能和统计学来预测患者的疾病进展和治疗效果;另外,人工智能和统计学还可以用于图像识别,帮助医生准确诊断疾病,比如有些人工智能模型可以自动检测肿瘤,并提供病理分析和患者愈后信息。在交通领域,人工智能和统计学可以用来规划最佳路线、避免拥堵和优化飞行计划等。例如,高德地图就是一个基于人工智能技术的导航系统,可以帮助我们规划出最佳路线。在商业领域,人工智能和统计学可以用来分析市场趋势和客户需求,帮助企业做出正确的决策。例如,许多电子商务平台都使用人工智能算法向用户推荐产品或服务。在教育领域,人工智能和统计学可以用来个性化教学,提供定制的学习计划和资源。例如,一些在线学习平台使用人工智能算法来自动评估学生的学习进度和理解程度,并根据评估结果提供相应的教学资源和建议,等等。
第三,人工智能技术的发展推动了统计学的创新和进步。随着人工智能技术的不断发展和应用,统计学也面临着新的问题和挑战,例如处理大量数据、处理高维数据、模型选择等问题。为了解决这些问题,统计学不断创新和发展,提出了一系列新的理论和方法,如深度学习、因果推断、强化学习等。这些新的理论方法又反过来促进了人工智能技术的发展,使得人工智能系统更加智能、灵活和可靠。
第四,人工智能技术的快速发展促进了统计学与其他学科的交叉融合。人工智能技术涉及多个学科领域,例如计算机科学、人工智能、数学、统计学、物理学等。在这个过程中,人工智能技术与其他学科的交叉融合成为一种趋势,通过跨学科融合,可以实现知识的交流和整合,促进不同领域的协同创新。如图1-5所示。
图1-5 统计学与人工智能技术的关系
人工智能的智能程度目前还是有限的,它只能完成已知的任务,不能像人类一样具有创造性思维和自主决策能力,即人工智能在某些领域的应用仍然存在一定的局限性。数据是统计学与人工智能的共同基础,因此,不仅统计学成为人工智能发展的重要支柱,同时人工智能也进一步丰富了统计学的研究范畴,革新了统计学的方法与技术。
3.大模型
大模型是指通过深度学习算法和人工神经网络,训练出拥有超大规模参数(通常在10亿个以上)、超强计算资源的机器学习模型,能够处理海量数据,完成各种复杂任务,如自然语言处理、图像识别等。大模型分为通用大模型和行业大模型两种。
通用大模型是指能够处理多种任务和领域的模型,通用大模型通常基于大规模的、多样化的数据集进行训练,这些数据集涵盖了各个领域的知识。行业大模型是指用于特定行业的大规模机器学习模型。这些模型通常通过大量的专业数据进行训练,并具有强大的预测和决策能力。行业大模型可以应用于各种领域,如金融、医疗、交通等,以解决复杂的问题并提供智能化的解决方案,如金融风控、医疗诊断等。
统计学和机器学习都是数据科学的分支,都是利用数据来建立模型,并利用模型来进行预测或决策。但是,统计学更注重对数据进行描述、分析和推断,而机器学习更侧重于对数据进行学习、优化和泛化。它们的相似之处在于,都是为了提高模型的性能和效率。
而机器学习面具之下的本质仍然是统计。将大模型中先进的算法和技术与传统统计模型相结合的实践,是人工智能时代统计学研究的一个重要趋势。从这个角度上说,统计学与大模型之间的关系十分密切,二者相互依存,相互促进,共同发展。
总之,统计无处不在,统计无时不有。只要准确、科学、充分地应用统计,统计就能发挥出强大作用。
1.怎样理解“统计无处不在,统计无时不有”?试举身边三例统计事项。
2.统计职能有哪些?怎样理解统计职能和统计作用之间的关系?