购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 统计数据的来源与类型

1.2.1 统计数据的来源

我们站在统计数据使用者的角度看,统计数据主要来源于两种渠道:一是直接的调查和科学实验,这是统计数据的直接来源,我们称之为第一手资料或直接的统计数据;二是别人调查或试验的数据,这是统计数据的间接来源,我们称之为第二手或间接的统计数据。

1.统计数据的直接来源

统计数据的直接来源主要有两个渠道:一是通过专门组织的统计调查获得的数据称为 调查数据 ,统计调查是取得社会经济数据的重要手段;二是通过科学试验得到的数据称为 实验数据 ,科学试验是取得自然科学数据的主要手段。

统计调查就是按照统计的研究任务,运用科学的统计调查方法,有计划、有组织地向客观实际搜集资料的过程。其基本任务是:通过具体的调查,取得反映社会经济现象总体数量全部或部分以数字资料为主的信息。统计调查与一般社会调查一样,是调查研究活动,但它以搜集数字资料为主要特征。统计调查是对总体认识的起点,是进行统计整理与分析阶段工作的前提。统计调查的基本要求是准确性和及时性。

科学实验是搜集数据的另一种方法,在实验中控制一或多个变量,在有控制的条件下得到观测结果。所以, 实验数据 是指在实验中控制实验对象而搜集到的数据。通过科学实验搜集数据的方法已被广泛运用到各个领域,除了工业、农业等领域需要通过科学实验来采集数据外,军事学、心理学、教育学、社会学、经济学、管理学的研究中也有大量地使用实验的方法获取所需要的数据。

2.统计数据的间接来源

统计数据的间接来源主要是公开出版的或公开报道的数据,来源的渠道有很多。在我国,公开出版或报道的社会经济数据主要来自国家和地方的统计部门及各种报刊媒介,如公开出版的各类统计年鉴、定期发布的统计公告、统计部门和各级政府部门公布的有关资料、各类经济信息中心和信息咨询机构等提供的市场信息和行业发展的数据情报等;另外,广泛发布在互联网、各种报纸、杂志、图书、广播、电视传媒中的各种数据资料也属于间接数据。

相对而言,这种间接数据的搜集比较容易,采集数据的成本低,并且能很快得到。但是,间接数据也有很大的局限性,研究者在使用间接数据时要保持谨慎的态度。因为间接数据并不是为你特定的研究问题而产生的,因此针对你的研究所设置的指标体系来采集数据,并不是一件容易的事,如经常会碰到数据资料不够全面、数据的准确性不够、数据资料的口径可能不一致等问题。另外,提醒研究者需注意的是,在引用间接数据时,一定要注明数据资料的来源。这样做一是使你的研究成果可信,二是尊重他人的劳动成果。

【拓展视频】

阅读专栏1-4

伪造、篡改统计资料

伪造统计资料,是指行为人没有任何客观事实根据,主观地编造虚假统计数据或者统计资料并报送的行为。构成伪造统计资料须具备两个条件:一是行为人主观上必须是故意的;二是必须有捏造虚假的统计资料并上报的行为。具体表现为,行为人所报送的统计数据或者统计资料,没有相应的原始记录、统计台账和其他相关的凭证。或者捏造一套原始统计资料和汇总资料。例如,某村实际上没有轧钢厂,但该村为了完成年初乡里下达的任务,在报送统计资料时凭空造出一个轧钢厂,并以该村的名义报送工业产值1000万元。

篡改统计资料,是指行为人利用某种职务或者工作上的便利条件,擅自修改现有的统计资料并报送的行为。构成篡改统计资料须具备两个条件:一是行为人在主观上必须是故意的,即明知被修改的统计资料是真实的,修改的结果必然导致数据失真,但仍然希望这种结果发生;二是必须有故意篡改统计资料的行为,例如,某县乡镇企业公司为了达到“全县乡镇企业稳步快速发展”和“明年日子好过”的目的,用“以丰补歉”的方法擅自对该县某村5个企业1995年实际上报的工业总产值22500万元进行修改,修改后的工业总产值只剩6200万元。

伪造和篡改统计资料区别在于:伪造统计资料是凭空捏造,无中生有;篡改统计资料是在现有的统计资料的基础上进行非法修改。

判断虚报、瞒报、伪造、篡改统计资料的标准:如果行为人是通过伪造或者篡改的手段而导致统计数据失实,则其行为应认定为伪造或者篡改统计资料的违法行为;如果行为人未通过伪造或者篡改的手段,而是由于其他原因导致统计数据失实,则其行为应认定为虚报或者瞒报统计资料的违法行为。

资料来源:天津统计信息网http://www.stats-tj.gov.cn.

【拓展案例】

1.2.2 统计数据的类型

统计数据是对现象进行计量的结果。下面我们从不同角度说明统计数据的分类。

1.分类数据、顺序数据和数值型数据

按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

1)分类数据

只能归于某一类别的非数字型数据,称为分类数据(Categorical Data)。例如,人口按照性别可分为男、女两类;企业按照经济性质可分为国有企业、集体企业、三资企业和个体企业等。这类数据是无序的,没有大小的比较。

为便于统计处理,对于分类数据可以指定数字代码表示。例如,用0表示男性,用1表示女性;用1表示国有企业,用2表示集体企业,用3表示三资企业,用4表示个体企业。

2)顺序数据

只能归于某一有序类别的非数字型数据,称为顺序数据(Rank Data)。例如,学生的考试成绩可以分为优、良、中、及格和不及格;消费者对产品的偏爱程度可以分为很喜欢、喜欢、一般喜欢、不喜欢,等等。这类数据是有序的,可以进行比较。

同样,对顺序数据也可以指定数字代码表示。例如,用1表示优,用2表示良,用3表示中,用4表示及格,用5表示不及格;用4表示很喜欢,用3表示喜欢,用2表示一般喜欢,用1表示不喜欢。

3)数值型数据

按照数字尺度测量的观测值,称为数值型数据(Metric Data)。我们所研究的数据大多是属于这类数据。数值型数据按取值方式可以分为离散数值型数据和连续数值型数据。例如,到现在为止你订过杂志的数量、你家里的人口数等,都属于离散数值型数据;你的身高、体重等,都属于连续数值型数据。

分类数据和顺序数据说明的是事物的品质特征,通常用文字表示;而数值型数据说明的是现象的数量特征,通常用数值表示。

2.观察数据和实验数据

按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。

1)观察数据

通过调查或者观测而收集到的数据,称为观察数据(Observational Data)。这类数据是在没有对事物人为控制的条件下所得出的,有关社会经济现象的统计数据几乎都是观察数据。

2)实验数据

在实验中控制实验对象而收集到的数据,称为实验数据(Experimental Data)。在自然科学领域中应用时所使用的统计数据大多是实验数据。

3.截面数据和时间序列数据

按照被描述的对象与时间之间的关系,可以将统计数据分为截面数据与时间序列数据。

1)截面数据

截面数据(Cross-Sectional Data)是指在相同或近似相同的时间点上所收集的数据,用来描述现象在某一时刻的变化情况。例如,2015年我国各地区的GDP数据就属于截面数据。

2)时间序列数据

时间序列数据(Time Series Data)是指在不同时间上所收集到的数据,用来描述现象随时间而变化的情况。例如,1996—2015年我国的GDP数据就属于时间序列数据。由一系列时间序列数据排列而得出的一组数据称为时间序列,又称为动态数列。对于时间序列的研究是统计学中的一个重要的内容。

区分统计数据的类型十分重要,因为对不同类型的数据将采用不同的统计方法来处理。

阅读案例1-2

统计学在批判性思考中的应用

工程与科学中的试验研究一般都牵涉利用试验数据(样本)推断某个概念性总体的性质,而这个概念性的总体刻画了实验者感兴趣的现象。这个推断过程是科学方法的一个组成部分。基于试验数据的推断首先用来提出有关现象的理论,然后利用另外的样本数据来试验这个理论。

统计科学对这个过程是怎样发挥作用的?为了回答这个问题,我们必须注意基于样本数据的推断几乎都是有误差的,因为样本不能提供总体精确的映像。样本提供的信息特征依赖于选取的特定样本,因此不同样本得到的信息是不一样的。例如,假定你想估计美国石化工厂中,所有应力腐蚀破裂而导致合金钢损坏的比例,你调查了一个100个合金钢损坏的样本的原因,发现47个是应力腐蚀破裂导致的。这是否意味着在石化工厂中所有合金钢损坏都精确地有47%是应力腐蚀破裂造成的呢?显然不是。假定你不知道合金钢损坏应力腐蚀破裂的真实百分比是44%。100个损坏的样本可能有47个是应力腐蚀破裂导致的,而另一个100个损坏的样本中可能只有42个。因此,基于样本的推断具有 不确定性

另一方面,假定一个石化工厂曾经有一次合金钢损坏率为81%,当给定样本损坏率为47%时,这是否是一个非常高的损坏率呢?统计理论用概率来度量关于推断的不确定性。这使得工程师和科学家有能力在有关总体的特殊假定下,计算观测到的特殊样本或者数据测量值的概率。这些概率用来评估关于样本推断的不确定性。例如,在给定的样本信息下,我们可以通过计算观测到如此高比例的机会,来确定工厂81%的合金钢损坏率是否非常高。

因此,统计学的主要贡献是,使得工程师和科学家能够用已知的可靠性度量做出推断(关于目标总体的估计及决策)。这样工程师可以根据数据做出明智的决策与推断,即统计学帮助工程师批判性地思考他们的结论。

资料来源:[美]William Mendenhall, Terry Sincich.统计学 [M].梁冯珍,关静,等译.北京:机械工业出版社,2009.

实例分析

解读《2015年国民经济和社会发展统计公报——工业》

根据国家统计局网站公布的《2015年国民经济和社会发展统计公报》,全国工业增加值及同比增长如图1.3所示。

全年全部工业增加值为228974亿元,比上年增长5.9%。规模以上工业增加值增长6.1%。在规模以上工业中,分经济类型看,国有控股企业增长1.4%,集体企业增长1.2%,股份制企业增长7.3%,外商及港澳台商投资企业增长3.7%,私营企业增长8.6%。分门类看,采矿业增长2.7%,制造业增长7.0%,电力、热力、燃气及水生产和供应业增长1.4%。

图1.3 2015年全国工业增加值及同比增长图

全年规模以上工业中,农副食品加工业增加值比上年增长5.5%,纺织业增长7.0%,化学原料和化学制品制造业增长9.5%,非金属矿物制品业增长6.5%,黑色金属冶炼和压延加工业增长5.4%,通用设备制造业增长2.9%,专用设备制造业增长3.4%,汽车制造业增长6.7%,电气机械和器材制造业增长7.3%,计算机、通信和其他电子设备制造业增长10.5%,电力、热力生产和供应业增长0.5%。六大高耗能行业增加值比上年增长6.3%,占规模以上工业增加值的比例为27.8%。高技术制造业增加值增长10.2%,占规模以上工业增加值的比例为11.8%。装备制造业增加值增长6.8%,占规模以上工业增加值的比例为31.8%。

需要解决的问题:

(1)试描述该研究的统计目的。

(2)由2015年全国工业增加值及同比增长图可以看出哪些统计数据?

(3)调查了哪些企业?

(4)试描述该研究的统计分析过程。

一、学习目标

通过本案例的学习,要求学生结合实际问题熟练掌握基本的统计分析过程,正确理解统计学的基本概念。

二、案例分析

(1)该研究的统计目的是掌握2015年全部工业增加值及同比增长情况。

(2)由2015年全国工业增加值及同比增长图可以看出的统计数据如下:2015年,全年全部工业增加值为228974亿元,比上年增长5.9%。

(3)调查了全国规模以上工业企业,其中包括国有及国有控股企业、集体企业、股份制企业、外商及港澳台商投资企业和私营企业等。

(4)首先从宏观范围分析了全年全部工业增加值及其同比增长情况。接下来,具体分析了规模以上工业企业中不同类型的企业,如国有及国有控股企业、集体企业、股份制企业、外商及港澳台商投资企业、私营企业等工业增加值增长情况;并对39个工业大类中的不同行业,如煤炭开采和洗选业、石油和天然气开采业、农副食品加工业、纺织业、通用设备制造业、专用设备制造业、交通运输设备制造业、通信设备、计算机及其他电子设备制造业、电气机械及器材制造业、6大高载能行业、高技术制造业等的工业增加值增长情况进行了统计分析。

本章小结

本章是应用统计基础的开篇章,主要阐述统计学的基本理论和基本概念。通过本章的学习,要求对这门课程有一个初步的认识,正确的理解课程的研究对象、特点、研究过程及方法,熟练掌握贯穿于本门课程的基本概念,为系统学习全书各章节内容奠定理论基础。

关键术语

Statistics统计学

Statistical work统计工作

Appliedstatistics应用统计学

Inferential Statistics推断统计

Sample样本

Statistic统计量

Indication指标

Qualitative indication质量指标

Categorical data分类数据

Metricdata数值型数据

Experimental data实验数据

Timeseries data时间序列数据

Statistical data统计数据

Theoretical statistics理论统计学

Descriptive Statistics描述统计

Population总体

Parameter参数

Symbol标志

Quantitative indication数量指标

Indicative system指标体系

Rankdata顺序数据

Observational data观察数据

Cross-sectional data截面数据

知识链接

[1][美]尼尔·J.萨尔金德.爱上统计学 [M].2版.史玲玲,译.重庆:重庆大学出版社,2011.

[2]曾艳英.应用统计基础 [M].北京:机械工业出版社,2010.

[3]贾俊平,何晓群,金勇进.统计学 [M].6版.北京:中国人民大学出版社,2015.

[4]统计网络学习馆(台湾,论坛、统计教学等丰富内容):http://estat.ncku.edu.tw/.

[5]《管理统计学》国家级精品课程网站:http://course.tju.edu.cn/gltjx/index.html.

[6]浙江大学《应用统计学》国家级精品课程网站:http://jpck.zju.edu.cn/tj/

习题 1

一、选择题

1.社会经济统计的研究对象是()。

A.抽象的数量特征和数量关系

B.社会经济现象的规律性

C.社会经济现象的数量特征和数量关系

D.社会经济统计认识过程的规律和方法

2.工业企业的设备台数、产品产值是()。

A.连续数值型数据

B.离散数值型数据

C.前者是连续数值型数据,后者是离散数值型数据

D.前者是离散数值型数据,后者是连续数值型数据

3.几位学生的某门课成绩(单位:分)分别是67、78、88、89、96, “学生成绩”是()。

A.品质标志

B.数量标志

C.标志值

D.数量指标

4.在全国人口普查中()。

A.男性是品质标志

B.人的年龄是离散数值型数据

C.人口的平均寿命是数量标志

D.全国人口是统计指标

5.下列指标中属于质量指标的是()。

A.社会总产值

B.产品合格率

C.产品总成本

D.人口总数

6.指标是说明总体特征的,标志是说明个体特征的,()。

A.标志和指标之间的关系是固定不变的B.标志和指标之间的关系是可以变化的

C.标志和指标都只能用数值表示

D.只有指标才可以用数值表示

7.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。

A.绝对数

B.相对数

C.平均数

D.百分数

8.要了解某地区的就业情况,()。

A.全部成年人是研究的总体

B.成年人口总数是统计指标

C.成年人口就业率是统计标志

D.反映每个人特征的职业是数量指标

E.某人职业是教师是标志值

9.下列统计指标中,属于质量指标的有()。

A.工资总额

B.平均产品成本

C.出勤人数

D.人口密度

E.合格品率

10.下列各项中,属于连续型变量的有()。

A.基本建设投资额

B.岛屿个数

C.国民生产总值

D.居民生活费用价格指数

E.就业人口数

二、简答题

1.区别下列概念。

(1)统计与统计学。

(2)总体与样本。

(3)标志与指标。

(4)数量指标与质量指标。

(5)分类数据与数值型数据。

(6)描述统计学与推断统计学。

2.下面这些数据是分类数据、顺序数据还是数值型数据?如果是数值型数据,是离散型还是连续型?

(1)性别:男,女。

(2)体重:123,140.2等。

(3)汽车速度:78,64,45等。

(4)温度:78,64,85等。

(5)兄弟姐妹个数:0~2,3~5,6个及以上。

(6)成绩:A, B, C等。

(7)员工对企业某项改革措施的态度:赞成,中立,反对。

(8)产品中的次品数:0,1,2,3,4, …。

3.某大学欲了解在校大学生的身体素质,从中随机抽取500名在籍大学生,测量了他们的身高、体重。

(1)从总体的两层含义分别给出研究问题的总体及其容量。

(2)给出相应的样本及其容量。

(3)该大学对总体的什么特征感兴趣?

4.根据总体的一般性定义,试指明下列调查研究中的总体、样本和个体。哪些是有限总体?哪些是无限总体?

(1)天津市2015年大学生应届毕业生初次就业的情况。

(2)2015年全国国有企业经济效益情况。

(3)随机抽样得到1000名在校大学生上一年伙食费支出的数据,推断全校在校大学生上一年平均伙食费支出。

(4)某市质检部门从市场上抽取不同品牌的奶粉共80袋,试图对市场上销售的奶粉的质量做出评估。

(5)从中小企业板块随机抽取40支股票的连续30天的价格,分析该板块股票价格波动情况。

5.某咨询公司准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入。从数理统计的角度指出:

(1)这项研究的总体是什么?

(2)这项研究的样本是什么?

(3)这项研究的参数是什么?

(4)这项研究的统计量是什么?

6.一家工厂的质量检验人员某日从该企业共随机抽取100件产品,以检验产品的合格率。根据这一事实回答下列问题:

(1)根据总体的一般性定义,指出此项统计研究的总体、个体和样本。

(2)指出此项统计研究的指标。

(3)指出此项统计研究所确定的指标是数量指标还是质量指标。

(4)指出此项统计研究的参数和统计量。

7.某单位由10个部门组成一个总体,下面哪些是数量指标?哪些是质量指标?

(1)10个部门的职工人数。

(2)第3个部门的职工年工资总额。

(3)该单位固定资产总值。

(4)第9个部门职工的年平均工资总额。

(5)10个部门的平均劳动生产率。

8.假设我国2016年1~4月份规模以上工业企业主要财务指标有关资料如表1-2所示。

表1-2 2016年1~4月份规模以上工业企业主要财务指标

注:经济类型分组之间存在交叉,故各经济类型企业数据之和大于总计。

要求:(1)试指出表1-2中的总体、总体单位、数量指标、质量指标。

(2)为获得表1-2中的资料,应调查总体单位的哪些标志?哪些标志是品质标志?哪些标志是数量标志?

三、判断题

1.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。()

2.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。()

3.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。()

4.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。()

5.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。()

实际操作训练

1.实训项目:消费者网上购物统计调查

实训目的:掌握统计调查中常用的统计基本概念,理解并会正确使用。

实训内容:一项调查表明,消费者每月在网上购物的平均花费是500元,他们选择在网上购物的主要原因是“价格便宜”。回答以下问题:

(1)这一研究的总体是什么?

(2)“消费者在网上购物原因”是分类数据、顺序数据还是数值型数据?

(3)研究者所关心的参数是什么?

(4)“消费者在网上购物的平均花费是500元”是参数还是统计量?

(5)研究者所使用的主要是描述统计还是推断统计的方法?

2.实训项目:高校在校学生的择业观念的统计调查

实训目的:掌握统计调查中常用的统计基本概念,理解并会正确使用。

实训内容:某科研机构对本市范围内的5所高校在校学生的择业观念情况进行了调查,以了解新时期大学生的择业倾向、择业心态及其成因。活动的主要目的是为政府制定大学生就业的政策法规、管理制度,增强宏观管理的科学性和针对性提供依据;为高校的有关大学生就业指导中心有针对性地做好大学生就业指导工作提供信息支持;为高校的大学生择业思想教育提供客观的依据,培养大学生正确的择业观和人生观。

在这次调查活动中,他们是如何确定统计总体和样本的?在调查中又有可能出现哪些统计概念呢?

3.组成学习探讨小组,每组提出一项统计研究目的,列出为此而开展统计研究的总体和样本,并同时列出其中的标志(品质标志和数量标志)、指标(数量指标和质量指标)等,并尝试构建一套指标体系。

案例思考与讨论

解读《2014年国民经济和社会发展统计公报》部分内容

2014年,面对复杂多变的国际环境和艰巨繁重的国内发展改革稳定任务,党中央、国务院团结带领全国各族人民,牢牢把握国内外发展大势,坚持稳中求进工作总基调,全力推进改革开放,着力创新宏观调控,奋力激发市场活力,努力培育创新动力,国民经济在新常态下平稳运行,结构调整出现积极变化,发展质量不断提高,民生事业持续改善,实现了经济社会持续稳定发展。

一、农业

全年粮食种植面积11274万公顷,比上年增加78万公顷。棉花种植面积422万公顷,减少13万公顷。油料种植面积1408万公顷,增加6万公顷。糖料种植面积191万公顷,减少9万公顷。

粮食再获丰收。全年粮食产量60710万吨,比上年增加516万吨,增产0.9%。其中,夏粮产量13660万吨,增产3.6%;早稻产量3401万吨,减产0.4%;秋粮产量43649万吨,增产0.1%。全年谷物产量55727万吨,比上年增产0.8%。其中,稻谷产量20643万吨,增产1.4%;小麦产量12617万吨,增产3.5%;玉米产量21567万吨,减产1.3%。

二、固定资产投资

固定资产投资增速放缓。全年全社会固定资产投资512761亿元,比上年增长15.3%,扣除价格因素,实际增长14.7%。其中,固定资产投资(不含农户)502005亿元,增长15.7%,农户投资10756亿元,增长2.0%。东部地区投资206454亿元,比上年增长15.4%;中部地区投资124112亿元,增长17.6%;西部地区投资129171亿元,增长17.2%;东北地区投资46096亿元,增长2.7%。

三、国内贸易

市场销售稳定增长。全年社会消费品零售总额262394亿元,比上年增长12.0%,扣除价格因素,实际增长10.9%。按经营地统计,城镇消费品零售额226368亿元,增长11.8%;乡村消费品零售额36027亿元,增长12.9%。按消费类型统计,商品零售额234534亿元,增长12.2%;餐饮收入额27860亿元,增长9.7%。全年网上零售额27898亿元,比上年增长49.7%。其中,限额以上单位网上零售额4400亿元,增长56.2%。

四、对外经济

全年货物进出口总额264334亿元,比上年增长2.3%。其中,出口143912亿元,增长4.9%;进口120423亿元,下降0.6%。进出口差额(出口减进口)23489亿元,比上年增加7395亿元。

根据以上案例回答下列问题:

(1)举例说明统计的研究对象是什么。

(2)案例中提到了什么统计总体?

(3)案例中提到的标志有几种?举例说明什么是指标。

(4)案例中用了什么研究方法?

解读2009年《中华人民共和国统计法》的修订内容

【相关法规】

解读2009年《中华人民共和国统计法》的修订内容,分小组讨论:

(1)2009年新修订的《中华人民共和国统计法》有何意义?

(2)结合实际提出保障统计数据质量、提高统计公信力的建议和措施。

【参考答案】 /w4uSUhN9asPBtILrkwr5X51++QdibTEbmTI//11CBvdCk9+O5Cc0uoEB/LXV+OU

点击中间区域
呼出菜单
上一章
目录
下一章
×