购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

二、是数据分析,更是数据决策

在这一小节,我们来学习这本书有别于其他数据分析课程的独有部分:数据决策。为什么这么说?首先,前文说过数据分析可以分为描述性分析、相关性分析和预测性分析。不管哪种分析,最终的目的还是决策;其次,常见数据分析模型过分依赖数据质量,而现实数据状况则是缺乏和低质量为主。没了张屠夫就得吃带毛猪?下文会讲到,在缺乏数据和不确定情况下,怎样做数据决策。

“不是我不明白,只是这世界变化太快!”崔健几十年前的歌词居然现在还不过时。人心本就难测,再加上利益纷争,现在外部环境又变化太快。现代人忽然发现脚下居然没有一块稳固的基石。企业是以上冲突的集中爆发地。在瞬息万变的环境下,企业决策者怎样能及时收集到市场变化,做出准确有效的决策?

决策模式对比

中国领导人说过:“国家的发展未必只有一个模式”,决策也是如此,可按模式、属性来分类:

(1)跟随决策

先听马老师的决策理论:“因为相信,所以看见!”这句话最早我在某个项目的老板处听来,马老师在视频里说他也是听人讲的?这句话自然有他的道理,但我作为一名数据分析师,对此还是本能保持批判主义精神。

“因为相信,所以看见!”也可以理解为“因为愿意,所以相信!”这种决策方式无可厚非,但是要警惕一厢情愿过度。这在心理学上被称为“期望偏差”:因期望的存在而导致的错误,因过早或强烈期望某件事到来,而产生幻觉,进而造成决策偏差。

(2)自主决策

相信自己的,而不是权威的眼和脑,则是另一些人的选择。法国科学家拉普拉斯给拿破仑上课,讲解怎样用牛顿万有引力定律来计算行星轨迹。皇帝问:“在您的理论中,上帝在哪里?”科学家平静的回答:“陛下,我的理论不需要这样的假设。”拉普拉斯们信奉的是“因为看见,所以相信!”

客观的说两种决策模式各有千秋,没有对错,只有不同场景下的适合不适合。既然有奋力破开风雨的头雁,自然也有跟随协同的群雁。扪心自问:你想做头雁、独雁还是群雁呢?

决策方式进化

决策除了按模式、属性来分类,还可以从角色上划分:

(1)传统决策

决策者压力山大,常说一把手工程,往往是被迫的结果。

(2)专家决策

咨询公司的职责不仅是提供专业知识,最重要的职责是分担决策者的决策风险,顺便做企业决策者不方便做的工作。我的一位北大师兄是国内著名咨询机构的高级合伙人。我在创业失败后的茫然失措中,找这位师兄,问他能否走咨询这条路。师兄盯着我问了一句话:“你真想做咨询吗?”直到今天才终于有了答案:“授人以鱼不如授人以渔!”相较于替客户出主意,我更喜欢帮助客户学会自己拿主意。

(3)数据决策

如下图所示,数据决策表现如中心雷达图的最外测一圈,全方位提升风险控制、成本控制、信息效率和执行效率!

上图:数据决策模+型(红线:数据决策;绿线:咨询;灰线:个人决策)

好是真好,难也是真难,一言难尽,最后一章再谈。

从数据分析到科学决策

什么是科学决策?

我们首先明确几个术语:在涉及定量决策方法的知识体系中,“管理科学”“决策科学”和“运筹学”这三个术语常被混用,今天已不再有区别。科学决策解决的是在动态和不确定情况下,如何有效利用稀缺资源的问题。定量决策方法也就是数据决策方法。

科学决策方法有三个特点:

(1)逆向决策。 数据决策是从目标结果倒推输入变量的逆向决策。通过衡量目标的完成数值,数据决策方案的有效性能得到客观评估。

(2)慢决策。 数据决策是慢决策,甚至是不决策,而不是快决策。推荐丹尼尔·卡尼曼的《思考快与慢》,简单说大脑有两个决策系统:快系统和慢系统,快系统特点是直觉、情绪、省力,可以被看成是已经训练好的决策模型;而慢系统的特点则是主动控制、理性、专注,可以被看成是待训练的新决策模型。两种模型互相配合才能避免决策偏差。

数据决策用数据说话,拥有系统化的计算过程,明显是一种慢系统。

(3)近似决策。 数据决策方法是近似决策,而不是精确决策。数据决策的目的是解决问题,不追求完美和绝对解决方案,综合考虑成本和效益,秉承够用就好的原则。

这本书首先讲数据分析,遵循数据挖掘的标准流程,掌握常见的数据分析模型,所有的模型都是符合Y 指标 =F 关联 (X 维度 ),都是以指标、维度和关联作为核心要素。然后是科学决策,也叫运筹学,这部分是本书跟通常的数据分析课的最大的差别:

(1)不惟数据。 数据分析最大的问题是分析精度对数据本身质量依赖太高。而科学决策则融合了线性规划等科学决策方法,对不确定性的环境和数据缺乏有很强的鲁棒性,也就是耐操。

(2)不惟算法。 尽量简单,非专业人员也能用。不以机器学习算法为重心,但更偏向于需要人参与的分析模型,尤其是复杂问题的决策精算法。比如下面讲到的大数估算法。

费米与大数估算法

前面的收费邮箱案例给我们一个启示:对一个不确定性很大的问题,用很简单的加减乘除和数据粗略估算,居然也能得到基本满意的答案。但是,大家不觉得奇怪吗?如果估算的转化比例大幅偏离真实情况,那么这样的数据预测还有存在价值吗?

解决数据估算不准的奥秘就是费米的大数估算法。这种方法与现在流行的机器学习有紧密的联系,但也有两点区别:近似但简单和数据依赖性低。这两个特性正好针对性解决了前文中说的非数据专业人士的“三无”困境。

大神费米是意大利裔美国物理学家,1938年获得诺贝尔物理学奖。他的照片都是笑模笑样的,感觉与其说他是严谨的科学家,不如说更像位和气生财的算命先生。喜欢他还有重要原因:诺奖获得者对我来说就是不可直视的太阳,五年前兴冲冲买来霍大爷的《时间简史》,可折页没羞没臊的,永久的停在了第一章。而费米就不一样,他的大数估算法居然能让我自以为能懂!跟大神跨越时空的神交令人心旷神怡。

举一例大数估算法的神迹:1945年7月16日第一颗原子弹在新墨西哥州的沙漠引爆成功,试爆40秒后,现场附近的费米感受到冲击波的气浪,伸手向空中撒了一把碎纸片,落在他身后2.5米的地方。费米估算出的爆炸威力相当于一万吨TNT,而仪器测到的数值大约是两万吨。

费米思想的核心:就是说把一个庞大的、抽象的、复杂的问题,逐级分解为微小的、具体的、简单的问题,只要保证了逻辑关系,那么这些小问题答案逐步反推,最终初始问题就可以得到相对准确答案。麦肯锡把这个方法叫做“逻辑树法”。

费米曾提出一个有趣的问题:“芝加哥有多少钢琴调音师?”初看这个题目,有没有无处下手的感觉?但是,费米把这个大问题分解成一系列小问题。

第一个小问题是芝加哥有多少台钢琴?

芝加哥总居民数约300万,平均每个家庭有4个人(美国四人家庭居多),那么芝加哥估计会有75万个家庭。在当时的美国,钢琴属于半稀缺物品,拥有钢琴的家庭应不超过1/2,也不会低于1/10,因此费米估算为1/3,那么全市大概有25万架钢琴。

第二个小问题是每架钢琴每年需要调音多少时间?

调音师不是常见的岗位,调音次数应该不会超过1年3次,也不会低于10年1次,因此费米估算为3年1次,调音一次的时间不会超过10小时,也不会低于1小时,因此费米估算为3小时。那么每架钢琴每年需要调音多少时间就是1小时。

这样我们就计算出:所有钢琴的总调音时长大约是1×250000=250000小时

第三个小问题是每年每位调音师工作多少小时?

假设调音师一年工作250天,算上他每天需要往返的路时,那么他一年的工作时间就是250×24×0.6= 3600 H。

最终,调音师数量=249000/3600= 69位。

费米的学生们打电话确认:芝加哥的钢琴调音师共80位,只差了13.75%!

上图:费米的大数估算法

大数估算法为什么这么准?准确率的保障就是平均律:在任何一组计算中,估算带来的错误都可以相互抵消,所做的假设越多,被抵消的概率误差就会越大。

科学决策方法

常用的科学决策方法包括:

(1)线性规划: 约束条件与目标函数都是线性的。

(2)非线性规划: 约束条件与目标函数不都是线性的。

(3)等候线模型: 平衡服务等待中的客户满意度与服务成本。

(4)库存模型: 库存量既要满足销售需求,又要维持低水平。

(5)配送网络模型: 解决运输系统设计的最优效率问题。

其中“线性规划”是应用最广泛和相对简便的决策方法,后面章节会涉及。 8/Bk6uD8VPuYXvI/MkrnSVSBnJMaAg18pMkhcFRU+mInK+sHX+m4C4KgTSQ3Km2d

点击中间区域
呼出菜单
上一章
目录
下一章
×