本章介绍什么是数据分析、进行电商数据分析所需的各项技能以及数据分析在电商中的应用,让读者了解数据分析可以做什么,以及电商数据分析人才需要具备的知识和能力。
在新电子商务时代,数据被赋予了特殊的使命,从业者将不断研究如何用数据驱动运营,把数据资产转变成生产力,从而提高电商企业的数据化运营能力与销售业绩。
学习目标
· 了解电商数据分析常见的应用场景。
· 理解统计学等数学知识对数据分析的重要性。
· 掌握统计学的基本概念。
· 了解运筹学的基本概念。
· 掌握数据指标体系。
数据分析是将数据转变成有效信息的过程,其中数据具有历史性特征,信息具有指向性特征。
(1)数据的历史性。数据是客观的事实,能够被收集到的数据都是已经发生了的事件所产生的结果。例如收集到某商品的销量,因为该商品已经发生了销售事件,所以才会产生销量指标。
(2)信息的指向性。由于每个人的生活背景、工作经验的不同,因此每个人对相同的数据可能会产生不同的看法,也就是说每个人对有效信息的理解可能不同。且从数据中提炼的信息并不适用于所有人,只有特定的某一部分人才会关注该信息。
在数据分析的过程中,建立一个恰当的参考框架是核心工作。例如,在分析自己店铺的数据时,我们需要建立一个参考框架(见图1-1),将店铺与同期的行业整体进行比较。所有的分析都是基于这个参考框架进行的,这样可以充分利用参考框架提供的信息。
数据分析使用不同的角度观察事物,运用维度和指标的不同组合,全面地看待事物的样貌。从这个角度来理解,数据分析就是在研究维度和指标的组合关系。
图1-1 数据分析的参考框架
数据分析可以在运营过程中给决策者提供决策依据,特定的分析维度可以帮助决策者做出有效的决策,而有效的决策可以提高项目的成功率。
例1-1 :某线下企业想进入线上市场,考虑成本因素,决策者需要决定是先开淘宝店(集市店)还是先开天猫店,哪一个选择对企业更有利?
采集该企业所经营的类目店铺及经营数据,统计分组后的数据对比如图1-2所示,如果选择入驻淘宝平台,将面临激烈的竞争,而天猫平台的竞争小、份额大。综上,建议入驻天猫平台,由天猫平台进入市场。
例1-2 :某企业在优化某商品标题时,需要替换标题中的某些词,但是哪些词被替换后可以提高引流效果呢?
收集该商品的关键词数据,不同词根的表现数据如图1-3所示,可以发现“情人节”“手工”“友情”这3个词根都没有产生流量,因此将这3个词根删掉不会影响商品现有的流量和销量,而且替换新的有效词根会提高引流效果。
图1-2 不同平台的数据对比
图1-3 不同词根的表现数据
总而言之,数据能够帮助企业明确运营方向,使运营决策更精准,从而让项目的成功率更高,如图1-4所示。
图1-4 数据对运营的作用
数据是客观的事实,但是数据本身并不会告诉人们它的价值,其蕴涵的信息需要分析师进行挖掘。数据分析的流程分为8个步骤,如图1-5所示。
图1-5 数据分析的流程
数据分析是一种有目的的行为,比如,你想要了解销售情况,或者想找到数据之间的某种规律,一切行为操作都针对某个目标展开。因此进行数据分析的基础是目标明确,没有明确的目标,任何分析操作都可能是做无用功。
围绕目标选定进行数据分析的维度和指标,只有选定了范围才可以有目的地收集数据,并进行分析。明确的分析范围能避免分析报告内容太多、不深入。
例1-3 :分析目标是了解新上线的详情页的效果,为此选定分析的维度和指标。
解: 分析的维度有日期、页面,指标有停留时间、转化率。
数据是数据分析的基础,没有数据就无法开展数据分析工作,数据采集是将目标数据收集到计算机硬盘等存储空间中。基础的数据采集可采用Excel、八爪鱼、火车采集器、码栈等软件,进阶的数据采集可使用Python。
采集到的数据一般会有一部分“脏数据”,所以不能直接用于数据分析,如果不处理它们将会影响分析结果。所以在进行分析前需要对数据进行检查,如果发现“脏数据”就必须进行清洗。
例1-4 :表1-1所示为从淘宝生意参谋下载的店铺经营数据,其中第三行观测值中存在以“—”为标记的缺失值,如果不处理此类缺失值将无法进行下一步操作,因此需将数据中的“—”替换为数字“0”。
表1-1 店铺经营数据
数据清洗可使用Excel、Python等工具,亦可使用专业的ETL(Extract Transform Load,抽取、转换、装载)工具。利用Excel中的Power Query组件(Office 2016及以上版本自带该组件),可实现大量数据的清洗。
因为收集到的数据一般都是零散或者杂乱的,直接观察数据难以洞察出有效信息,所以只有对其进行整理,才能保证后续流程顺利进行。
按照某个维度汇总数据才能对其进行有效的观察。比如,要观察新的详情页上线后用户行为的变化,可以按照上线前和上线后的用户行为数据进行分类汇总,然后通过这两份数据的对比来得出结论。
例1-5 :表1-2所示为淘宝网女装T恤和衬衫两个品类在2023年1~3月的成交金额数据,将数据整理成表1-3所示的形式,更便于分析。
表1-2 未经整理的成交金额数据
表1-3 整理后的成交金额数据 单位:千万元
数据分析的目的是将数据转变成有效的信息。前面的步骤都是为这一步做准备,信息的提炼可以采用对比法、拆分法、分组法等分析方法。
例1-6 :表1-4所示为商品标题中的关键词词根分析结果。观察表1-4中的支付买家数,可以发现“收纳箱”和“大号”这两个词根的支付买家数为0,表示没有用户通过这两个词根产生交易,因此得到的信息是“收纳箱”和“大号”这两个词根可以优化。
表1-4 关键词词根分析结果 单位:个
数据可视化旨在借助图形化手段,清晰、有效地传达信息。
例1-7 :将表1-5中的数据直观地展现出来。
表1-5 多个产品的对比数据
根据表1-5中的数据画出雷达图,如图1-6所示,各个产品间的差异清晰可见。
图1-6 雷达图
数据报告是对分析结果进行逻辑性的集中展现并阐述分析的文档,可以采用PPT、Word文档等形式。图1-7所示为一份数据报告示例。
图1-7 数据报告示例
电商数据分析师和业务数据分析师在团队中的定位相似,他们都需要掌握多种技能才可以完成数据分析任务。数据分析并不是一门独立的学科,它跟多门学科的知识有着紧密的联系。
(1)统计学:统计学是数据分析最基本的理论知识学科,数据分析就是统计学的应用。
(2)运筹学:运筹学是现代管理学的一门重要专业基础课,主要研究求最优解,可解决运营过程中的最佳决策问题。
(3)数据分析方法论:数据分析方法论是前人经验的归纳,套用方法论可以快速入门数据分析。
(4)数据分析工具:“工欲善其事,必先利其器”,单靠手工(笔尖)或者计算器速度太慢,而且整理大量的资料需要专业的技能,因此熟练掌握至少一个分析工具将大大提高数据分析的效率和准确度。
(5)电商业务能力:对一名数据分析师来说,业务场景的敏锐度十分重要,只有懂业务的数据分析师才能很好地将数据转变成生产力。
(6)电商数据指标体系:了解并掌握电商数据指标体系可以帮助分析师更快、更准确地开展数据分析工作。
数据分析从统计学发展而来,而统计学从数学发展而来。数学知识是数据分析的理论基础,只会软件操作并不能满足数据分析的要求,普通的商业数据分析师要求具有高中及以上的数学水平,要求能看懂数学符号和数学公式;如果涉及数学建模,则要求数学水平在大学本科及以上,如图1-8所示。具体的技能要求如下。
图1-8 数学水平要求
(1)初中数学:数学运算(基本运算、因式分解)、方程与方程组、不等式与不等式组(简单的线性规划)、初步统计(平均数、众数、中位数、极差、方差、标准差、频数、频率、频率分布直方图)、初步概率(概率计算)等。
(2)高中数学:集合(交、并、补)、基本初等函数(指数函数、对数函数、幂函数)、函数的应用(求极值、最值以及变化趋势)、算法(结构与语句)、数列(递推逻辑、归纳演绎)、简易逻辑(真假命题、假设逻辑)、合情推理(归纳、类比)、演绎推理(三段论)等。
(3)统计学:抽样调查与推断、概率论、描述统计学、推断统计学等。
(4)高等数学(更深层次的学习与研究):线性代数、微积分、复变函数等。
运筹学是现代管理学的一门重要专业基础课,也是数据分析的理论基础。它是20世纪30年代初发展起来的一门学科,其主要目的是在决策时为管理人员提供科学依据,是实现有效管理、正确决策和现代化管理的重要方法。该学科是应用数学和形式科学的跨领域研究,利用统计学、数学模型和算法等寻找复杂问题的最佳或近似最佳的答案。
在电商业务背景下,运筹学具有非常广泛的应用场景,如确定最佳的推广方案、确定最短的运营路径、确定最佳的产品组合、确定最佳的人工排班方案等。
许多电商从业者在分析数据的时候会遇到许多问题:不知从哪方面切入并开展分析,不知分析的内容和指标是否合理、完整……遇到这些问题大多数是因为分析人员缺少方法论。
方法论可以让分析人员依照某些轨迹顺利地开展分析活动,常见的分析方法有以下9种。
(1)对比法:只有通过与参照物的对比才能了解现状、发现问题,通过横向和纵向的对比找到自己所处的位置。
(2)拆分法:将大问题和相关的指标拆解成多个小问题和多个相关指标,快速找到问题产生的原因。
(3)分组法:将数据依据某些维度进行分组统计,观察分组后的结果并分析事物的特征。
(4)排序法:基于某个度量值进行递增或递减的排序,查看所有观测值的情况。
(5)交叉法:对两个及以上维度的数据进行交叉分析,比如对产品特征和价格区间两个维度的数据进行交叉分析,找到更符合企业定位的细分市场。
(6)降维法:如果分析问题时指标的信息量过多,采用业务梳理的方式选择核心指标进行分析,减少过多指标的干扰。在统计学上也可以使用主成分分析或因子分析的方法达到降维的目的。
(7)增维法:如果分析问题时指标的信息量不足,通过计算派生出新的指标,其包含更多的信息量,比如搜索竞争度=搜索人气÷商品数。
(8)指标法:采用指标的方式分析结果,一般通过制作表格来查看分析结果。
(9)图形法:采用图形的方式以更加直观地分析结果。
除了以上分析方法之外,还有一些业务中常用的思维分析方法。
(1)SWOT分析法:通过该方法了解自己所处的环境,对内、外部因素进行分析并制订应对策略。
(2)描述性统计法:用来概括、描述事物整体状况以及事物间关联关系、类属关系的统计方法,基于统计值来表示数据的集中和离散等情况。
(3)矩阵分析法:将主要因素放在矩阵的两个维度轴进行定量或者定性分析,并通过某个点将数据分为4个象限。
(4)多维分析法:将3个及以上的维度放在表格、多维平面图或者三维图中进行观测分析。
(5)数据归一化方法:将数值映射在某一范围,例如[0,1]。消除因为值域不同而产生的分析难点,一般配合多维分析法使用或在数据建模时使用。
(6)时间序列分析法:针对连续变化的时间数据的分析方法,主要用于预测连续的未来数据,比如分析店铺每天的成交金额(也称销售额)。
(7)相关性分析法:研究指标间的相关程度,常用于寻找关键影响因素。
掌握两个及两个以上的分析工具能更好地进行数据分析,分析工具大体可分成以下3类。
(1)数据库:按照数据结构来组织、存储和管理数据的仓库,常见的数据库有Access、MySQL、Oracle、DB2等。
(2)数据分析与可视化:用于组织数据并进行数据分析和可视化的工具,常见的工具有Excel、Power BI、Tableau等。
(3)统计与挖掘数据:用于进行统计分析和数据挖掘的工具,常见的工具有R语言、Python、SPSS、SAS等。
根据企业的不同需求阶段,数据分析人员需要掌握的工具有所不同,具体如下。
第一阶段:这个阶段的数据一般用Excel或WPS文件存储,数据文件多而杂,经营多年的电商企业甚至会有超过10万张的历史数据表格。企业无法对庞大的历史数据进行分析,数据管理杂乱。这个阶段企业需要解决数据的统一管理及分析问题,可选用Excel和MySQL工具。Excel解决分析层和应用层的问题,MySQL解决大量数据的存储和计算问题,且Excel和MySQL在国内企业的占有率和普及率都相对较高。
第二阶段:这个阶段企业已经实现了数据的统一管理和分析,但随着数据量的增加和数据应用能力的提升,Excel已经满足不了对大量数据进行多表建模联合分析的需求,可能刷新一个分析模型文件所需的时间都会很久。此时需要使用BI产品满足复杂的业务建模需求,企业可选用微软旗下的Power BI。部分企业在这个阶段会有专业统计方法和数据挖掘的需求,可选择SPSS,其使用难度不大。SPSS有两个工具。一个是Statistics,用于统计分析;另一个是Modeler,用于商业数据的分析与挖掘。SPSS在国内企业的占有率较低。
第三阶段:这个阶段的企业已经属于数据驱动型企业,数据应用需要在生产、流通、销售和管理等各个环节渗透。随着数据种类的复杂化,原有的数据采集、清洗及算法应用的效率已经满足不了需求。要运用IT技术和算法解决商业问题,真正将数据转变成生产力,可以在R语言和Python之间择其一,这两者都是应用非常广泛的编程语言。
第四阶段:这个阶段的企业已经是资深的数据驱动型企业。进入这个阶段的企业只有少数的龙头企业,他们通过技术手段极大地提高工作效率和商业收益,转入智慧商业领域,运用大数据和人工智能升级改造所有的环节。企业在这个阶段需要应用大数据框架(如Hadoop等)来解决并发问题,并用人工智能框架(如TensorFlow等)来解决应用问题。
数据指标体系是指由相互之间有逻辑联系的指标构成的整体,是基于业务场景构建的。一个完善的数据指标体系可以给业务提供有力的支撑,而且可以防止因为人员的流动导致数据分析部门运作瘫痪。
业务之间的差异可能会导致不同电商平台、不同商户的数据指标体系存在差异,但是大体上都会以下面的公式展开:
成交金额=访客数×转化率×客单价
上式是电商行业的重要公式,基于这个公式可以延伸出数据指标体系。
电商中的数据分析是为了提高商业效益,增加企业利润。对电商企业经营过程中的各个环节进行数据分析,为经营者提供有效的决策依据,不但可以提高经营效率,还可以提高企业的经营能力。
常用的业务场景包含但不局限于以下10类场景。
(1)数据诊断:针对网店的数据,诊断分析运营过程中存在的问题。
(2)数据复盘:针对某个事件对各个工作环节产生的数据进行梳理,并还原事件发生的过程。
(3)市场分析:对市场的容量和发展趋势进行分析,掌握市场发展规律并预测市场未来走向。
(4)竞争分析:对竞争环境和竞品进行分析,掌握市场竞争情况以及产品与市场的差异。
(5)渠道分析:为决策提供依据,包含活动分析、广告分析和内容分析。
(6)活动分析:对活动进行效果预测、复盘分析,掌握消费者对活动的响应情况,提高活动效果。
(7)广告分析:对网店广告投放的效果进行分析,从而优化广告投放。
(8)产品分析:针对产品的销售、渠道、时间、结构等维度对产品的销售情况进行分析,以提出更好的产品营销策略,增加产品销售额。
(9)库存分析:对库存的周转率、补货数量等进行分析,避免产品堆积而产生不良库存。
(10)消费者分析:对网店消费者复购情况、满意度等进行分析,避免消费者流失,提高消费者的留存率。
对电商运营者而言,如果数据是运营的眼睛,那么数据分析便是运营的视力。一样的数据给不同的运营者会得到不同的决策结果,每个人看到的都是基于自己的“视力水平”所呈现的结果。
本书将运营中常见的数据分析场景逐一举例,使运营人员能够快速套用对应场景的分析思路和方法,从而提高运营水平。数据的红利仍在,但运营人员需要具备一定的能力才可以争取到红利。
通过数据分析获利的店铺比比皆是,下面列举3个相关场景。
(1)某网店在进行数据分析前的退款率高达20%,在对退款产品、退款消费者和原因进行分析后,优化产品详情页和打包发货环节,有效地将退款率降到8%。
(2)某网店在进行数据分析前的滞销率高达38%,在对滞销产品进行分析,对库存动销率进行预测后,优化滞销产品的营销策略,并用库存的发货速度指导采购部门的备货数量,有效地将滞销率降低到20%。
(3)某网店在进行数据分析前的支付转化率低至0.87%,在对客服数据和页面数据进行分析后,给客服下达响应时间、响应率等KPI(Key Performance Index,关键绩效指标),并参考同行优秀的页面进行页面优化后,支付转化率提高到1.7%。
数据诊断是指对网店运营的数据指标进行分析、对比,找出有异常的数据指标或者找出与分析问题最为相关的指标。
常用的店铺快速诊断方法有以下两种。
(1)杜邦分析法(DuPont Analysis):将相关指标进行拆解,并展示最相关的指标变化,从而通过指标间的关联和变化快速发现店铺的问题。
(2)相关性分析法(Correlation Analysis):先分析问题找到核心指标,再通过相关性分析找出与问题核心指标相关程度较高的指标,有针对性地分析这些指标。
数据复盘是针对某个事件对各个工作环节产生的数据进行梳理,并还原事件发生的过程。这个事件可能是某次大促或者某项方案的执行。
复盘与诊断相近,容易混淆。数据复盘是还原具体的每一个过程,分析的数据包含工作人员的数据,比如客服人员拨打了100位网店消费者的电话。数据复盘能从整个过程中进行提炼和总结,而数据诊断并不需要还原过程。
市场分析是指应用统计学、计量经济学等分析工具,对特定市场的运行状况、产品生产、销售、技术、市场竞争力、市场政策等市场要素进行深入的分析,从而发现市场运行的内在规律,进一步预测未来市场发展的趋势。市场分析是发现和掌握市场运行规律的必经之路,是企业发展的“大脑”,对指导企业的经营规划和发展具有决定性意义。
市场分析包含以下6个方面的内容。
(1)市场容量分析:分析的是市场相对规模。市场规模是难以估算的,使用统计学方法估算的结果并不靠谱,因此要用电商的市场数据(抽样)来分析电商的相对规模,给决策者提供有价值的参考依据。
(2)市场趋势分析:对市场的自然规律进行探索,以及对未来的发展趋势进行预测,让决策者根据市场发展趋势提前做出判断,并对经营策略进行调整。
(3)市场细分分析:市场细分是市场选择的基础,需要根据消费者群体将市场划分成多个子市场,子市场之间的需求存在明显的差异。
(4)品牌分析:以品牌为分析维度,研究品牌市场的分布,从而找到市场空白。
(5)竞争分析:分析市场竞争环境和竞争对手,掌握竞争信息,便于企业制订市场营销策略。
(6)细分市场选择:根据自身情况估计每个细分市场的优势与劣势,并选择进入一个或多个细分市场。
竞争分析是针对竞争市场环境和竞争对手开展的分析,能帮助企业更深入地了解市场和自己的同行竞争对手。
竞争分析包含以下4个方面的内容。
(1)竞争环境分析:对电商平台搜索环境、价格和品牌进行分析,分析结果代表了企业的市场成本及进入门槛的高低。
(2)竞争对手的选择:确定行业竞争标杆,根据竞争对手矩阵和对手类型,确定不同时期的行业竞争标杆,能够对企业的发展起到正面的引导作用。
(3)竞争对手数据跟踪:长期收集并跟踪竞争对手的数据,掌握竞争对手的动态。
(4)竞争对手分析:针对某个竞争对手的用户、产品、渠道等开展的分析。
渠道分析是指对电商的流量渠道进行精细化分析,对各个渠道的销售情况、用户、价格分布等细节进行分析,以帮助企业调整渠道布局。
渠道分析包含以下两个方面的内容。
(1)传统流量渠道分析:对传统的聚合式的渠道(比如搜索、活动、首页、广告等)入口进行分析,掌握各个渠道的市场表现和用户的特征,以帮助企业优化渠道运营策略。
(2)社交渠道分析:对分布式的社交渠道(比如微淘、淘宝直播等)入口进行分析,对投放在渠道的商品、内容进行分析,从而指导企业调整社交渠道的运营策略。
活动分析及广告分析是指对促销活动和广告投放的效果进行分析,从而了解企业营销活动和广告的情况,并对下一阶段的工作提出优化建议,对某些区域的促销和广告策略进行局部调整,对用户进行更精准的营销。
活动分析及广告分析包含以下4个方面的内容。
(1)活动效果预测:分析产品的活动效果,对活动销量进行预估,帮助企业制订活动营销策略。
(2)活动效果对比分析:活动结束后对活动数据与同类活动、日销数据进行对比分析,总结活动的成败。
(3)关键词效果分析:分析广告投放的关键词的效果和趋势,从而给营销推广提供决策依据。
(4)地域效果分析:分析广告投放地域的效果和趋势,从而给营销推广提供决策依据。
产品分析是指对企业产品结构和销售情况进行分析,通过对这些指标的分析来指导企业产品结构和运营策略的调整,提升产品的竞争力。
产品分析包含以下4个方面的内容。
(1)产品结构分析:对产品的价格、品类、热卖程度等因素进行分析,了解各类产品的比例关系,从而调整产品的生产计划和销售策略。
(2)产品矩阵:通过矩阵分析法分析产品,基于两个或多个因素的相互作用对产品的影响,洞察产品所处的态势,从而确定产品的战略发展方向。
(3)产品生命周期分析:基于产品的销售趋势分析产品的生命周期,包含从产品的构想到产品消失的整个过程。
(4)产品销售分析:主要分析各个因素(如销售时段、地域、价格等)对销售绩效的不同作用,通过产品间的对比了解热销产品和滞销产品,制订出产品的销售策略。
库存分析是对企业的库存绩效进行分析,包括库存预警和补货数量的分析,可帮助企业提高仓库管理能力,提高库存绩效,减少不良库存。
库存分析包含以下两个方面的内容。
(1)库存绩效分析:对库存的存量、动销率、售罄率、库存周转率等进行分析,帮助企业管理库存,掌握库存的情况。
(2)补货数量测算:对产品补货进行测算,帮助企业科学补货。
现阶段电商企业获取消费者的成本极高,获取一个新消费者的成本甚至要数百元,提高消费者的价值和预防消费者的流失对电商企业来讲非常重要。对消费者的价值进行分析,有助于提高企业的运营能力。
消费者分析包含以下4个方面的内容。
(1)消费者分布:掌握消费者的分布情况,可以了解消费者的大致画像,有助于提高营销效果;根据消费者分布的地区来制订营销计划,可以降低广告成本。
(2)RFM模型:基于RFM模型对消费者价值和消费者创利能力进行评判和标注,经营者可以有针对性地对消费者进行分类管理。
(3)复购分析:对消费者的复购情况进行分析,了解消费者对该品牌、产品或者服务的购买次数,重复购买率越高,消费者对该品牌的忠诚度就越高,重复购买率越低则忠诚度越低。
(4)舆情分析:对消费者在线上留下的文字(聊天记录、评论等)进行统计和模型分析,了解消费者对品牌、产品的看法,以及需求和情感上的喜恶。这对品牌、产品的战略定位能起到非常重要的作用,有助于运营者做出正确的决策。
统计学是数据分析领域十分重要的理论基础,数据分析的主要思想和方法论便来源于统计学。
统计学是关于认识客观现象总体数量特征和数量关系的科学,是通过搜集、整理、分析和统计资料,认识客观现象数量规律性的方法论科学。由于统计学的定量研究具有客观、准确和可检验的特点,所以统计方法就成为实证研究中最重要的方法,广泛适用于自然、社会、经济、科学技术等领域的分析与研究。
统计学是一门很古老的学科,起源于社会经济问题的研究,迄今已有两千三百多年的历史。
统计学(Statistics)最早由戈特弗里德·阿亨瓦尔(Gottfried Achenwall)于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。19世纪,统计学在广泛的数据及资料中探究其意义,由约翰·辛克莱(John Sinclair)引进英语世界。
统计的研究对象是客观现象的数量特征和数量关系。统计研究不同于其他学科的研究,因为它有以下特点。
(1)统计离不开数据,一切用数据说话。
(2)统计的最终目的是研究总体,而不是研究个体,通过寻找事物的共性从而掌握事物的规律。
(3)统计以显示客观事物独立存在的实际情况为目的,数据反映的是事物的真相,统计学则是揭开真相的工具。
(1)统计总体。
统计总体是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
(2)总体单位。
总体单位是指构成统计总体的各个单位。总体单位必须是现实生活中存在的个体,不能是虚构的或意念中的事物。
(3)统计总体的特征。
统计总体具有同质性、大量性和变异性三大特征。
① 同质性。同质性是指构成统计总体的每个个别单位虽然在许多方面存在差异,但至少在某个方面保持相同的性质。同质性是统计总体形成的基础,构成统计总体的各个单位在某一性质上必须是相同的。
② 大量性。大量性是指统计总体由足够多的单位构成,个别或少数的事物不足以构成统计总体,这是由统计的研究对象决定的。统计的研究对象是客观现象的数量特征和数量关系,少量事物所表现出来的特征往往带有偶然性,客观现象数量方面的规律只有在大量事物个别特征的汇总中才能显示出来,表现出同质性的倾向,从而帮助研究者认识到事物的必然性。
③ 变异性。变异性是指同一统计总体的各个单位除了具有某种或某些共同的性质外,在其他方面是存在差异的,这种差异称为变异。如果统计总体中的每个单位在各个方面都一样,就没有统计的必要。正是因为变异的普遍存在,才有必要进行统计调查和分析,以寻找统计总体的一般规律。
(4)统计总体的分类。
按照总体单位是否可数,统计总体分为有限总体和无限总体。有限总体的规模和范围相对较小,是由有限的个别事物构成的总体。无限总体是指总体所包括的个别事物很多,无法计量。
(5)统计总体与总体单位的关系。
统计总体和总体单位不是固定不变的,它们会随着统计研究的目的不同而变化。一个事物在一种情况下是统计总体,但在另一种情况下有可能变成总体单位。
(1)标志。
标志是说明总体单位的特征或属性的名称。每个总体单位从不同方面考察,都有许多属性和特征。
标志与总体单位的关系是十分明确的,如果没有标志就无法表现总体单位的特征,如果没有总体单位,标志也就失去了意义。