广告统计学概论最新章节_林升梁著

第二节
数据的收集

一、统计数据的直接来源

广告统计调查第一手数据资料，常用的广告统计数据的直接来源主要有以下三种。

1.普查

普查是为某一特定目的而专门组织的一次性全面广告调查活动。如 2007 年6 月，针对当时户外广告设置凌乱、档次不高等问题，山东省济宁市综合执法局对现有城区户外广告设置展开大规模普查，利用两个月的时间，进行拉网式统计。在全面调查摸底的基础上，随后迅速进行户外广告清理整治和规范管理。此次大普查范围主要是城市规划区主次干道、国道、省道、高速公路两侧和广场、绿地、车站、码头、河道、桥梁等部位、节点的楼顶广告、墙体广告、落地广告、大型立柱广告、道路灯箱广告、门店招牌、公共设施广告、交通工具广告等。通过调查摸底，全面掌握城市规划区主次干道两侧户外广告的数量、设置位置、设置占用位置产权单位、设置经营单位、审批部门、许可证发放验证时间、发布时效期限、广告内容、规格、制作材料、亮化设施及效果、整治建议等内容。此次普查后，城管部门将出台相关规范标准，规避户外广告设置存在的安全隐患。

普查是一种特殊的数据收集方式，具有以下特点：

（1）普查通常是一次性或周期性的。由于人力、物力和财力的限制，普查一般需要间隔较长的时间进行一次。

（2）普查需要规定统一的标准调查时间。不统一时间，调查的结果就会出现数据重复和遗漏，影响结果的准确性。

（3）普查数据一般比较准确，标准化程度高。普查结果可以为抽样调查或其他调查提供基本的参照依据。

（4）普查使用范围比较狭窄，只能调查一些最基本、最一般的现象。

2.抽样调查

抽样调查是一种非全面调查，从全部调查研究对象中，抽选一部分单位进行调查，并据以对全部调查研究对象作出估计和推断。抽样调查虽然是非全面调查，但其目的却是要取得反映总体情况的信息资料，因而，也可起到全面调查的作用。

根据抽选样本的方法，抽样调查可以分为概率抽样（随机抽样）和非概率抽样（非随机抽样）两类。概率抽样按照概率论和数理统计的原理从调查研究的总体中，根据随机原则来抽选样本，并从数量上对总体的某些特征作出估计推断，对推断出可能出现的误差可以从概率意义上加以控制。

如，2006 年 5 月 16 日，第五次中国互联网信息资源调查报告在京发布，此次调查始于 2005 年 12 月，结束于 2006 年 2 月，为期三个月。排序后的网站编号依次为 1、2、3……M（M为全部备案网站的数目）。如果需要抽取的样本网站数量为n，取T ＝ Round（M/n），抽取规则如下：首先随机从1 到T中选出一个数S，那么编号为P ＝ S ＋ k*T（k ＝ 0、1、2、3……n-1）（M为全部备案网站的数目）的网站即为被抽取的样本网站（当P ＞ M时，取P ＝ P-M）。样本抽取采用的是等距抽样方法进行的，因此整个样本可视为近似的自加权样本，采用简单随机样本的公式对估计量进行计算。同时可对结果以各类网站数占网站总数的比例作为权重进行事后加权以校正误差。调查结果显示，2005 年包括域名、网站及网页等在内的互联网络信息资源继续大幅度提升，其中CN域名已经成为亚洲最大的国家顶级域名。

抽样调查应用广泛，是一种科学、可靠的调查统计方法。与其他非全面调查相比，抽样调查具有以下特点：

（1）抽样调查从总体中抽选出来进行调查并用以推断总体的调查样本，是按照随机原则抽选出来的，由于不受任何主观意图的影响，因此总体中各个单位都有被抽中的可能性，能够保证被抽中的调查样本在总体中的合理、均匀分布，调查出现倾向性偏差的可能性是极小的，样本对总体的代表性很强。

（2）抽样调查是以抽选出的全部调查样本作为一个“代表团”来代表总体的，而不是用随意挑选出来的个别单位来代表总体，使调查样本具有充分的代表性。

（3）抽样调查所抽选的调查样本数量，是根据要调查的总体各个单位之间的差异程度和调查推断总体允许的误差大小，经过科学的计算确定的。由于在调查样本的数量上有可靠的保证，样本就会与总体实际十分接近。

（4）抽样调查中的样本误差，在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算，可以把样本误差控制在一定范围之内，调查结果的准确程度比较有把握。

与其他调查一样，抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种：一种是工作误差（也称登记误差或调查误差），一种是代表性误差（也称抽样误差）。但是，抽样调查可以通过抽样设计，通过计算并采用一系列科学的方法，把代表性误差控制在允许的范围之内；另外，由于调查单位少，代表性强，所需调查人员少，工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下，抽样调查结果的准确性要高于全面调查。因此，抽样调查的结果是可靠的，是可以用来代表总体的。

3.统计报表

广告统计报表是我国目前收集统计数据的一种重要方式。广告统计报表是广告经营单位自下而上逐级提供基本统计数据的一种调查形式。统计报表大部分是全面的，按照时间长短可分为日报、旬报、月报、季报、半年报、年报等。《中国广告年鉴》每年都有对全国广告经营单位基本情况、广告公司基本情况等进行统计，采用的就是统计报表的形式。

除上面介绍的三种主要类型外，实际中有时也用到重点调查和典型调查。重点调查和典型调查都是非全面调查，但它们跟抽样调查有很大不同，抽样调查可以推断总体数量特征，而重点调查和典型调查的结果不能推断总体。

二、统计数据的间接来源

追根溯源，所有的广告统计资料都来源于统计调查，所以，经过长期积累下来的统计资料虽然是二手资料，也是获得信息的重要途径。广告统计数据的间接来源主要有以下三种。

1.中国广告年鉴

中国广告年鉴汇集了每年中国广告经营各个方面的统计信息，这些信息由国家工商管理局提供，具有相当的权威性。

2.会议资料及报告

目前，中国广告界重要的学术会议有中国广告教育研究会、中国广告协会学术委员会举办的会议等。这些会议规格高，每次会议一般都会有论文集问世，这些论文代表了广告行业的最高水平。此外，每年中国互联网发布的报告，具有相当的权威性。

3.历史文献与著作

长期以来，广告学者积累的各种历史文献及相关著作，提供了丰富的信息来源。有些历史文献可以从中国期刊网上查询，有些可以从国外一些重要期刊如 Advertising Age 、 Journal of Advertising Research 等上查询。

除了上面介绍的三种主要类型外，报纸、杂志、广播、电视、网络等都提供了丰富的信息来源。

统计数据质量是一个具有丰富内涵的综合性概念。具体来说，它包括统计数据的内容质量、表述质量及约束标准三个方面。

三、统计数据的质量

（一）统计数据的误差

1.抽样误差（sampling error）

抽样是随机的，会带来误差。抽样误差指所有样本可能的结构与总体真值之间的平均性差异。影响抽样误差大小的因素有样本量的大小、抽样方法、总体的变异性等。

2.非抽样误差（non-sampling error）

相对抽样误差而言，由于其他原因造成的样本观察结果与总体真值之间的差异，这些差异存在于所有的调查之中。常见的非抽样误差有抽样框误差、回答误差、无回答误差、调查员误差、测量误差等。

3.误差的控制

抽样误差可计算和控制，非抽样误差控制较难，主要有：

（1）调查员的挑选。

（2）调查员的培训。

（3）督导员的调查专业水平。

（4）调查过程控制。

（5）调查结果进行检验、评估。

（6）现场调查人员进行奖惩的制度。

（二）统计数据的质量要求

相关性、准确性与及时性是统计数据的内容质量的内涵，因此，这三者也是统计数据质量的主要特征，缺少任何一个，统计数据无法转化为信息。

1.相关性

统计得到的数据应该是用户感兴趣的数据，能满足用户的需求，关注用户的主题。由于对相关性的评价是主观的，随用户需求目标的改变而改变，所以，统计机构应平衡不同用户互相矛盾的需求目标，在给定的资源条件限制下，尽可能满足大部分用户的需求。

2.准确性

准确性指观测值或估计值与未知的真值之间的距离（接近程度），通常用统计误差来衡量。它是统计数据质量的基础和核心内容，也是传统的“统计数据质量”概念包涵的主要内容。一般来讲，误差分为系统误差和随机误差两部分，有时也用引起不准确性的主要潜在原因（如抽样误差、无回答误差等）来分类描述。完全准确的测量经常受成本的限制，有时甚至是不可能的，所以，误差以用户可以接受为适宜。

3.及时性

与用户需求相关的统计数据应该在用户做出决策前传递给用户，及时也是统计数据满足用户需求的重要特征。如果现象变化比较迅速，对该类统计数据的及时性要求高；如果该现象本身变化比较缓慢，则对及时性要求不高。

（三）统计数据的表述要求

对统计数据质量来说，仅考虑其内容方面的质量是远远不够的。统计数据需要表述，特别是某个统计数据要同其他相关统计数据相互联系时，要考虑表述的质量。比如，单个数据的内容是正确的，但表述不清晰、不充分，就会影响整套数据的质量，甚至引起误解。所以，统计数据质量必须考虑其表述质量。统计数据的表述质量包括可比性、可衔接性和可理解性。

1.可比性

同一项目的统计数据在时间上和空间上应能相互比较，这要求统计的概念和方法保持相对稳定，在不同地区使用统一的统计制度方法和分类标准，保持统计数据的口径范围、计算方法在时间上一致衔接，在地区之间可比。

2.可衔接性

同一统计机构内部不同统计调查项目之间、不同机构之间及与国际组织之间统计数据应能相互衔接。这要求全国范围内所有专业统计项目使用统一的统计框架体系、分类标准，按统一的方法编制统计数据，在统计调查和数据加工整理中使用统一的方法和程序，同时采用国际统计标准，如联合国 1993 年SNA的框架体系等。

3.可理解性

统计数据应便于用户理解并使用。统计数据提供给用户使用，用户不能理解，看不懂，谈不上使用。为了利用统计数据，用户必须了解数据的性质，统计机构应附带提供对数据的补充说明，如提供隐含在有关概念下面的说明、已使用的分类法、数据收集和加工过程中使用的方法及统计机构自身对数据质量的评价。

（四）统计数据的约束标准

除了统计数据的内容质量和表述质量，统计数据还必须符合以下两项具有普遍意义的约束标准。

1.可取得性

应方便用户从统计部门取得统计数据，统计数据必须以用户能够使用（搜寻方便）且能够负担的形式提供给用户。提供统计数据时，必须列明用户从统计机构可以取得的统计数据，应用先进便捷的统计数据服务方式，方便用户使用数据更为便利。

2.有效性

利用统计数据产生的效益要大于提供该数据的成本，效益太小，生产数据和购买数据都无意义。在统计数据的其他质量不受大的影响的前提下，尽可能降低统计数据的生产费用，提高效率。

第二节 数据的收集

一、统计数据的直接来源

二、统计数据的间接来源

三、统计数据的质量

第二节
数据的收集