19世纪末,意大利经济学家帕累托(V.Pareto)偶然注意到19世纪英国人的财富和收益模式,通过调查取样发现大部分的财富流向了少数人手里。帕累托(V.Pareto)在其著作中描述了观察到的现象,意大利80%的土地掌握在20%的人手中。这种现象在其他国家中也有体现。于是,他基于大量事实提出:社会上20%的人占有80%的社会财富,即财富在人口中的分配不平衡。
20世纪40年代,美国管理学家约瑟夫·朱兰(J.M.Juran)在商业管理中发现80%的影响来自20%的投入,他将描述社会财富分配不均的帕累托原理引入企业质量管理,并将该管理学原理命名为“帕累托法则” 。帕累托法则是帕累托思想在多领域的应用,帕累托法则认为事物的主要结果只取决于一小部分的因素。由于这些不平衡现象在数学上呈现出一种稳定的关系,因此帕累托法则又被称为“二八定律”。
帕累托分布是从大量真实世界的现象中发现的幂定律分布。齐普夫定律也是在帕累托思想指导下发展起来的。
假设 X 是一个符合帕累托分布的随机变量,那么 X 大于 x 的概率分布的生成函数为
其中 x m 是 X 最小的可能值(正数), α 是为正的参数。帕累托分布曲线特征就是由尺度参数 x m 和形状参数 α 两个数量决定。
根据定义,可以得出帕累托分布的累积概率分布函数为
当 x m =1时,不同 α 取值下帕累托分布的累积概率分布如图3-1所示。
图3-1 不同α取值下帕累托分布的累积概率分布
帕累托分布概率密度函数可表示为
当 x m =1时,帕累托分布对应的概率密度函数图像如图3-2所示。
图3-2 帕累托分布概率密度函数
帕累托分布属于连续概率分布。“齐普夫定律”可以被认为是在离散概率分布中的帕累托分布。从图3-2中可以直观地看出,在帕累托分布中, α 越小,后尾特征越明显。当 x →∞时,帕累托分布有一个阶数为 的尾部。
一个遵守帕累托分布的随机变量的期望值为 (如果 α ≤1,期望值为无穷大),标准差为 (如果 α ≤2,标准差不存在)。
帕累托法则与马太效应其实是对同一个现象不同表现形式的总结。马太效应是指好的越来越好、坏的越来越坏或者多的越来越多、少的越来越少的一种现象,而帕累托法则是发现大多数的财富掌握在极少数人手里。帕累托法则与马太效应的共同点是两者都是对现实社会中资源分布的不平衡现象的描述,在这两者思想之上更具有总结性的规律就是幂律分布 。在现实生活中,当资源有限而人口足够多时,总会出现少数极好和少数极差的现象,少数人获得多数资源。马太效应与帕累托法则的区别在于:首先,马太效应是对现象的描述,帕累托法则是根据社会现象通过数据进行数学统计上的验证和总结。其次,马太效应描述的是强者越强的动态资源分布,而帕累托法则是对资源分布不均衡的静态描述。最后,在马太效应与帕累托法则的应用中,马太效应更强调对消极影响的规避,实现资源合理分配;帕累托法则应用数学统计的方法,利用资源分布不均的现状,鼓励人们关注“少数”从而获得“更多”资源。
①数据分析中的二八定律思维。二八定律思维可以用来检验两组类似数据之间的关系,发现两组数据关系的关键起因,如20%的投入有80%的产出,80%的维基百科词条的创建与维护来自20%的人口。不同于线性思维,二八定律思维关注影响某一变量的关键原因,检验被大多数人所忽视的非线性关系。二八定律思维的应用一方面能以最小消耗获得最佳成果,另一方面对长尾部分进行了改进。
②科学技术的突破创新。20%的科学文献获得了80%的被引计数,20%的科学研究实现了80%的科学创新与突破。因此,关注头部文献的创新模式有助于推进科学突破的进程。
③App应用的UI迭代。一个移动App大多拥有几十甚至上百个UI页面,然而仅有少数的页面是用户经常用的。因此在App应用更新时,将有限的资源和时间投入少数关键页面能带来更大收益。