购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.5 描述视角

回到博文《访问量的启示》中,你还能看出哪些分析视角?

3.5.1 集中趋势与离中趋势

在博文中先计算了日访问量的平均数,然后展示了日访问量的波动情况。平均数刻画的是一般水平,是集中趋势;波动情况刻画的是变异程度,是离中趋势。而集中趋势和离中趋势属于描述统计的范畴,所以该博文还运用了描述统计视角,简称描述视角。

3.5.2 个体波动的研究价值

刚开始做数据分析时,往往很容易想到用平均数描述研究对象,但要想把研究对象描述全面,别忘了研究个体波动。

首先,研究个体波动能够帮助企业进行问题诊断。例如,博文《访问量的启示》通过对个体波动的研究,分析出日访问量低的三个原因,为博客运营提出了相应的改进建议。

其次,研究个体波动还能帮助企业找出欺诈行为(见案例4)。

最后,如果只看平均数,则往往会掩盖个体间的差异。尤其当波动很大时,平均水平对个体的代表性就会很差。例如,网上有一首打油诗(见图3-10):一个富翁上千万,邻居都是穷光蛋,平均数据一核算,人人都是上百万。这首打油诗很贴切地揭露了平均工资掩盖的个体间贫富差距的问题。

图3-10 揭露平均数弊端的打油诗

【案例4】疑似车险欺诈的“标的车”分析

某保险公司对半年内“标的车”的出险次数、换牌次数以及更换驾驶员的次数进行统计,发现累计有98%的“标的车”在半年内的出险次数、换牌次数以及更换驾驶员的次数均少于3次。

换句话说,出险、换牌或更换驾驶员的次数超过3次的“标的车”是少数的离异值,疑似存在车险欺诈(见图3-11)。

图3-11 疑似车险欺诈的“标的车”分析

注:气泡大小表示不同驾驶员个数的“标的车”比例。 +WBrdDuYSNssGYbsDup/AHu9ob4SF1+ckCZ/IOs3vkuhCG8ldefBCnweUk31UoXj

点击中间区域
呼出菜单
上一章
目录
下一章
×