购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

“平时”与“战时”:两类典型的需求预测问题

根据不确定性的大小,我们可以把预测分为两类情况,如图1-14所示:“战时”的不确定性大,要避免大错特错;“平时”的可预见性高,要追求精打细算。

“战时”指不确定性很大,历史数据很少甚至没有的情况,比如新产品上市、“双11”备货等。没有太多可参考的数据,人们就习惯于找专家判断,让销售、市场、产品经理等“拍脑袋”,容易出现大错特错。一个解决方案呢,就是德尔菲专家判断法:群策群力,整合跨职能、跨阶层的最佳判断,提高首发命中率, 避免大错特错

“平时”指历史数据较充分,需求的可预见性比较高的情况,比如成熟产品的需求。企业的大多数业务属于此列,但管理者的注意力集中在第一种情况,此类业务就交给基层人员,凭经验计划,这是另一种形式的“拍脑袋”。对于解决方案,我们要借助数据模型和数理统计, 精打细算、精益求精 ,以求交付和库存周转的最优化。

图1-14 “平时”与“战时”两类不同的预测问题

需求相对稳定时,选用数据模型来精打细算

先说个哲学性的话题:为什么可以预测?我们之所以能够预测,是基于:(1)时间序列的 延续性 (也叫连贯性);(2)变量之间的 相关性 (也叫类推性)。也就是说,发生过的跟尚未发生的有某种关系。

当需求的不确定性很高时,不管是延续性还是相关性,我们都不容易量化。但是,我们的头脑是最复杂的“AI”系统,能够建立变量之间非线性、难以描述的联系,这就是凭经验、“拍脑袋”。我们找有经验的人,就是因为他们的头脑里沉淀有更多的数据,他们的脑细胞也更可能让他们建立起这样的联系。

当需求的不确定性低时,特别是有了一定的需求历史后,历史与未来的延续性、相关性更容易建立,反映在一些简单而实用的模型中,这就是我们这里要讲的数据分析和数据模型。计划者的任务,就是找出和应用这样的关联性(预测模型),对未来做出预判,指导供应链执行来提前准备。

相关性 指变量之间存在的关系,可以类推。比如促销预算越高,买的广告、流量越多,产品的销量一般也会越高;预售期卖得好的产品,正常销售一般也会卖得好;在试点区卖得好的产品,在所有区域也会卖得不错。我们常说不怕不识货,就怕货比货,这“货比货”就是基于相关性,在数据有限的情况下,比如新产品的预测中,扮演重要角色。小步快走、尽快纠偏,也是通过有限时间、有限客户的需求,来推断整体的需求预测,其后的逻辑也是相关性。

你现在知道了,让营销判断,其实是借助他们以往的经历,比如以前做促销的时候,花了多少钱,买了多少流量,卖掉多少产品,来判断这次花多少钱,能卖多少货。这不是单纯地“拍脑袋”,这也是以数据分析为基础。试想想,每次做活动、要预算的时候,营销也得拿出点数据给老总,来证明为什么要100万元而不是60万元的预算。用得比较多的逻辑呢,就是相关性。

对于相关性,我们常用的模型就是线性回归法,即变量之间存在一定的线性关系,线性回归根据变量的多少又分为一元、二元、多元线性回归。线性回归听上去很高大上,其实我们每天都在用:投入多,产出就多,就是基本的线性回归思路。线性回归涉及一些基本的数理统计,在我的《需求预测和库存计划:一个实践者的角度》一书中有详细的描述(第57~77页),这里就不再重述。

延续性 体现在时间序列中,就是呈现一定的模式(见图1-15):(1)趋势——随着时间发展,需求呈现上升或者下降的趋势;(2)周期性——需求呈现交替性的波峰、波谷,季节性就是其中一种; (3)随机变动——在外界因素的影响下,需求展现出忽高忽低的变化,但整体上平稳。

如果只看图1-15中的实际值,我们是很难预测未来需求的。但当我们把其中的趋势和季节性分解出来以后,就找到了数据中的大部分规律:趋势是可以预测的,季节性也是。 剩余部分就是残余,亦即趋势和季节性数据模型没法解释的部分,我们把它归因于随机因素,一般依赖安全库存、供应链执行来应对。

图1-15 时间序列的分解示意

这些随机变动中,真正可能“害死”我们的是那些为数不多的波峰、波谷:前者可能造成短缺,后者可能导致过剩。说是随机,其实很多波峰、波谷不是随机产生的,而是因为发生了一些能够显著改变需求的行为,有些是客户驱动的,有些是我们自己主导的,有些由竞争对手导入——当我们不知道背后的驱动因素的时候,就把它们归之为“随机”。这就需要销售、产品、客户端的判断,对那些没发生但有可能发生的促销、活动、产品切换、市场竞争、政策变动等提前预判,完成需求预测的“由判断结束”。

看得出,对于这样的时间序列,大部分的预测工作通过数据模型即可完成,只有很少的部分需要判断。在需求计划薄弱的企业,计划往往没有能力提取需求历史中的规律性部分,于是就不分青红皂白地依赖一线销售提需求,耗费了一线的大量资源,反倒让一线没法聚焦那些真正需要管理的内容。结果就是既做不到“从数据开始”,也做不到“由判断结束”,预测准确度低下也就不难理解了。

对于图1-15中的随机变动、趋势和周期性,我们有相应的预测模型,下面予以简单介绍。

当需求没有明显的趋势、季节性的时候,我们认为变动主要是随机的,可以用 移动平均法 简单指数平滑法 来预测。这是两种最简单,应用也最广泛的预测模型,特别是后者。

移动平均法就是用过去一段时间的需求,求平均值,作为下一期的预测。当每期的权重相同时,叫简单移动平均法;当权重不同时,就叫加权移动平均法。比如用简单移动平均法按照3个月进行预测的话,7月的预测就等于4、5、6三个月需求的平均值。这里的关键是:究竟用多长的需求历史?这是移动平均法的择优,一般用复盘的方式来确定。比如我们已经知道最近13周每周的实际需求,我们可以用更老的需求历史,来复盘预测过去13周的需求,看3周移动平均的误差最小,还是6周或8周,等等。具体的操作,以及如何计算预测误差,评估预测准确度,在我的《需求预测和库存计划:一个实践者的角度》一书中有详细的描述(第13~17页)。

简单移动平均法假定每期的需求历史占比相同。这并不一定对,因为直觉告诉我们,最新的需求历史往往更有参考性。这就衍生出加权移动平均法,比如上一期的权重是30%,倒数第二期的为25%,倒数第三期的为20%等,所有权重加起来等于1。至于权重如何分配,这又是模型择优的任务,可通过计算不同权重分配下的预测准确度来确定。

你马上发现,看上去很简单的移动平均,其实要用好的话,一点也不简单:我们得确定用多长的需求历史(也就是我们通常说的,多长的需求历史有代表性),我们还得确定权重分配。在实际应用中,很多企业都是靠经验,选定一定时长的需求历史,要么简单平均,要么加权平均,当然是有优化完善的空间的。

我们接着介绍的 简单指数平滑法 ,其实是一种特殊的加权平均法:权重以几何数级衰减,越近的需求历史权重越大,越远的权重越小。究竟权重多大,衰减的速度多快,取决于平滑系数。该系数介于0~1,取值越大,最新需求历史的权重越大,预测模型越灵敏;取值越小,权重的衰减速度越慢,预测模型也越稳定。

在操作上,简单指数平滑法只用两个数据点:上期的实际值、上期的预测值,下期的预测是这两个值的加权平均。这逻辑就如踢足球:如图1-16所示,作为防守队员,你得预测下一步往哪儿跑——你是由预测驱动的,这取决于球现在停在哪里(上一期的实际值),以及你现在停在哪里(上一次的预测值)。有两个极端:一个是球跑到哪儿你就跟到哪儿,也就是百分之百地用上次的实际值作为预测值(平滑系数=1);另一个是不管球在哪儿,你按照你的老战略,也就是百分之百地沿用上次的预测(平滑系数=0)。你知道,两个极端都会让你输得很惨,你得在两者之间寻求平衡,这就是简单指数平滑法的择优,通过选择合适的平滑系数来实现。

图1-16 简单指数平滑法的逻辑就如防守队员的防守逻辑

跟移动平均法的择优逻辑一样,我们一般用复盘的方式,摘取一段有代表性的需求历史,用更老的数据来复盘预测,计算不同平滑系数下,每种简单指数平滑法的准确度,选择预测准确度最高,也就是预测误差最小的方法。

简单指数平滑法听上去很玄妙,其实操作起来很简单,自20世纪50年代发展起来以后,已经相当成熟。我们这里不再赘述方法论本身,我想说的是,为什么简单指数平滑法那么重要。

简单指数平滑法好,是因为逻辑上它更符合实际情况,比如越近的需求历史越有参考价值。这很重要,意味着它能更快地捡起新近发生过的事,及时更新预测。比如销售在前端做促销,但没有告诉你,而简单指数平滑法一看昨天的需求高了,就建议你今天多补些货过去。再比如你的生产线上昨天有个关键备件坏了,这种备件很少坏,属于典型的长尾,而它现在坏了,可能意味着这批设备开始老化,相应地,简单指数平滑法会把这个信号及时纳入预测中,提醒你得注意多备货了。

简单指数平滑法好,还因为它“简单”:只需要平滑系数一个参数即可。我们通过调整平滑系数,就可优化预测模型。比如业务变动大的时候,平滑系数就更大;业务比较稳定的时候,平滑系数可取更小的值。整体上,这一方法比移动平均法的预测准确度更高。

或许有人会问,既然有“简单”指数平滑法,那就也有“不简单”的指数平滑法了?是的,这就是我们接着要介绍的霍尔特模型、霍尔特–温特模型——分别来预测趋势、趋势加季节性的模型。

我们知道,简单指数平滑法适用于没有明显的趋势、没有明显的季节性的情况。因为如果有的话,简单指数平滑法就会有系统性的偏差,比如需求有增长或下降趋势时,简单指数平滑法会一直偏低或偏高(移动平均法也是)。

时间长了,需求往往会呈现一定的模式,不再光是随机变动。比如你开了个新店,或者导入了新产品,随着时间推进,口碑越来越好,业务呈现一定的上升趋势;再比如很多业务有一定的季节性,这时就需要更合适的模型来预测。

当时间足够长的时候,季节性的因素就往往不可避免。这个世界上,很难找到没有季节性的需求。有的是自然因素驱动,比如寒暑易节,热饮冷饮的业务交替变化,电力消耗、煤气消耗的变化;有的是人为因素驱动,比如季度考核导致季末冲量,6·18、“双11”等大促销。甚至连有些政府项目也有季节性:前半年走流程,审批预算;后半年做项目,突击花钱。

作为应对,霍尔特模型增加了一个平滑系数,来对付趋势问题;霍尔特-温特模型增加了两个平滑系数,一个应对趋势,一个应对季节性问题。

指数平滑法非常强大,还在于其 自适应性 。比如就趋势来说,我们可以用线性回归找出一条直线来模拟,其斜率是固定的,比较僵化;在霍尔特模型里,斜率本身是可调整的,我们用一条折线来模拟,拟合度自然要比一条直线高,预测准确度也更高。再比如我们常用的季节性模型中,季节性因子的权重是固定的(四个季度的权重加起来是1,但每个季度的权重是不变的);霍尔特-温特模型中,我们有专门的平滑系数,来动态调整季节性因子,这都让模型的拟合度更高,预测准确度也更高。

现在,我们在指数平滑法体系内,有了三类模型,能对付我们遇到的大部分需求预测问题,不管是随机变动,还是趋势性变动,或是季节性变动。 我们还可以调整相应的平滑系数,让这些模型更好地匹配实际业务。这也是为什么在预测领域, 指数平滑法是应用最广的方法 ,没有之一。在每一种计划软件里,你都能看到指数平滑法的影子,而且是主要的背景算法。人工智能、机器学习,也都离不开指数平滑法。

对于规律性的东西,没有人知道得比数据还多 。借助这些常用的预测模型,我们可以发掘数据中已知的规律,在预测上精益求精,优化交付和库存周转。当然,预测方法深似海,这里只是点到为止。更多的细节,比如指数平滑法的初始化,平滑系数的择优,实施中要注意的问题等,可参考我的《需求预测和库存计划:一个实践者的角度》一书。

此外,我还想强调三点。

其一,在预测方法上, 简单的模型往往比复杂的更有效,你能懂的模型往往强过你不懂的 。这里提到的移动平均法和指数平滑法,应该能够对付我们遇到的绝大多数问题。如果有人一开口就是傅里叶变换、机器学习、神经网络什么的,你得非常谨慎才对:那些都很重要,但它们更多的是喂饱你的第五个包子,你得先把简单的四个吃了。要选择合适的模型,避免系统和组织的两层皮问题:你没法理解的,就不会信任;不信任的话,就不会去用。

其二,预测模型要优化。优化本身并没有听上去那么难,一般是通过复盘,选择准确度更高的模型,Excel表里就可以做,关键是要做起来。这是计划职能可以独立控制的。对很多企业来说,通过简单的优化,把预测准确度提高几个百分点并不难——在预测方法的择优上,这些企业就如从没吃过药的原始人,只要给他们颗阿司匹林,就会有效果。可不要小看这几个百分点,那可能意味着几个百分点的净利润。

其三,预测模型知道它们知道的,不知道它们不知道的,所以一定要和职业判断相结合。请相信直觉: 如果模型的结果看上去不对,它十有八九是错了 。这是因为数据可能有问题,公式可能会套错,参数可能会选错,特别是在刚开始用模型的时候。业务和专业经验不可替代,这就是为什么不能光靠计算机来做计划。

实践者问

能把那些公式给我们,让我们写到程序里,来预测和补货吗?

刘宝红答

公式没什么特别,比如指数平滑法都是半个多世纪前的研究,从理论上讲相当成熟,也不难。要说难,难在两个方面:(1)数据模型的结果很大程度上取决于数据本身的质量,而数据清洗这样的事,没法完全交给公式或计算机;(2)数据模型完全依赖数据,知道它知道的,不知道它不知道的,即缺少了判断的成分。就这样,光靠公式,“从数据开始”有点勉强(因为数据清洗工作等欠缺),“由判断结束”则完全做不到。你知道,这样的计划结果不会理想。

对于上面介绍的简单指数平滑法、霍尔特模型、霍尔特–温特模型等一系列时间序列预测法,大家都可以到一个网站( https://www.real-statistics.com/free-download/ )上下载成套的模板和公式。这个网站是Charles Zaiontz博士开发的。这个人堪称极客般的存在,能把复杂的数理统计解释得非常清楚。

小贴士 计划软件往往优于人工,为什么不被采用

我接触过几个软件公司,都是开发计划软件的。它们有的基于数理统计,提供多种预测模型以供择优选用;有的基于人工智能,通过机器学习,为需求预测和库存计划提供独特的解决方案。这些软件都远非完美,不过整体而言,要比一帮计划员“拍脑袋”、各行其是强。但是,很多企业就是不愿采用,或者即便实施了计划软件,实际工作中还是在Excel中手工做计划。

我想主要有以下几个原因。

其一,计划软件没法有效应对大错特错,比如上新、促销、需求变动等造成的预测准确度太低的问题。我们知道,一个好的预测是“从数据开始,由判断结束”:好的软件系统可以帮助我们精益求精,做好基准预测,解决好“三分技术”的问题,完成“从数据开始”,但“七分管理”的问题,比如销售与运营协调,由销售、市场、产品端提供判断,更好地调整基准预测,却并不是软件能够解决的,所以没法“由判断结束”。

计划软件的特长不是帮你打通跨职能壁垒,促进跨职能协作,而是帮你精益求精,把那些主要是数据驱动的计划做得更好。我们用错误的标准来衡量计划软件,当然会得到错误的结论。对于软件开发者来说,如果定位不清,把大量的精力花在解决组织、流程问题上,八成是浪费资源,在对着错误的那棵树汪汪叫 。上帝的归上帝,凯撒的归凯撒:软件开发者要聚焦软件功能,应对数据分析,组织、流程问题是实施顾问们要对付的。

对于有些企业来说,因为整体运营实在粗放,还没有到精益求精的地步,它们其实没有能力上这样的计划软件,我倒是建议它们更多地发力组织、流程,促进销售与运营之间的协作,这样投资回报率或许更高。也就是说,先是组织流程,解决“七分管理”的问题;后是软件系统,改善“三分技术”的问题,如果不得不分先后顺序的话。对很多企业来说,改善计划的第一步不是上软件系统。用Excel也能做出不错的计划,如果“七分管理”的问题解决了的话。当然,“七分管理”做到了,避免大错特错的目的达到后,进一步就是追求精益求精,软件系统就不可回避。

其二,软件往往不能显著降低整体的库存水平。很多计划类软件把降低库存作为一大卖点,其实并非如此:好的计划软件一般会降低库存,但整体降幅往往并不显著;计划软件的更大价值在于改善库存结构,把合适的库存放在合适的产品上,在适度降低库存的同时,系统提高服务水平。让我们拿健身减肥来打比方说明。

跟健身减肥一样,库存控制分三个阶段。在初级阶段,库存很高,但客户要的没有,就如一身肥肉,都长在错误的地方——肚子上,结果是高库存、低有货,这是很多公司的起点。然后开始健身,整天跑步、举铁,一段时间下来,上秤一称,很失望地发现,体重并没多大变化,甚至增加了。想想看,整天锻炼,胃口更好了,吃得更多了,体重能减轻吗?但是,你也会注意到,你的身体更加匀称,肉长到合适的地方去了。这就到了高库存、高有货阶段。那就接着练,对自己更“狠”点,改变饮食结构,生活更节制,一点点把那些肥油给练下来,肌肉更多了,体重也下来了,这就到了低库存、高有货的第三阶段。

在这个三阶段“健身减肥”过程中,计划软件通过提高预测准确度、设置更合理的安全库存,把合适的库存放到合适的产品上,改善了粗放经营下,过剩和短缺并存的情况。可以说,计划软件主要在做第二阶段的事,实现高库存下的高有货。那怎么才能到达第三阶段呢?这就得回到库存的三大根源:周转周期、不确定性和组织行为,通过缩短周转周期来降低周转库存,减小需求和供应的不确定性来降低安全库存,以及改变组织行为来降低多余库存,这些我们在后文还会详细阐述。这需要营销、生产、采购和供应链的整体协作,更多的是个执行问题,而非计划和计划软件能应对的——计划软件更多的是准确地量化,但不是改变这些库存的根源。

其三,系统和组织两层皮,计划人员不愿放弃控制。这有点费解,简单地说,就是软件虽然很好,但由于各种因素很难用,计划的结果不可靠;或者其中的逻辑复杂,计划人员没法理解,不理解就不信任,不信任就自然不用。两者都导致系统和组织两层皮,即便上了计划软件,计划人员还是我行我素,继续在Excel表上做“道场”,计划软件就沦为上载计划结果,跟ERP对接的接口。

要知道,凡是计划软件,如果要得到可靠的结果,都要求清洗数据,比如把那些没有重复性的或者有错误的数据清理掉。这很费事,要做好的话,会占用相当多的时间。很多企业没有决心,也就没有资源把这事儿做好,结果就是“垃圾进”,注定也是“垃圾出”,对于计划软件的建议,计划团队当然不信,自然也不会去采用,软件系统就成了摆设。这是系统和组织两层皮的原因之一。

另一个原因呢,就是软件中的很多逻辑,比如预测模型的原理和择优,计划人员根本就不理解。数理统计虽然客观,但冷冰冰,很少有人真正理解。对于自己不理解的,我们自然没法信任,会感觉失控。人是追求确定性的,不光是结果的确定性,更重要的是过程的确定性,这都导致软件不被使用。

再加上设计这些逻辑的人呢,往往是一些IT背景的。我不想冒犯IT人员,但这真的不是他们的专长,他们只能生搬硬套一些公式。计划人员虽然不懂这些逻辑,但一眼就能看出,软件系统做出的计划并不靠谱,当然就不会去用了。在一个新零售企业,IT系统建议的采纳率不足30%,我们也不能抱怨业务人员不采纳。这种情况下,我是宁肯一线提需求,因为他们提需求做不到精益求精,但更可能避免大错特错。系统建议呢,则是盲人骑瞎马,造成灾难的可能性更大。

实践者问

我们在用某ERP软件自带的计划模块来做预测,发现功能不齐全,用户友好性也差。怎么办?

刘宝红答

计划模块不是ERP软件公司的主业,也不是他们软件的卖点。这就如你到大酒店里,让他们做个鸡蛋灌饼给你吃一样,他们可能不做,如果做的话也一定没有街头小摊做得地道。那怎么办?我们得找专业的计划软件。市面上有一些这样的软件,各有利弊,得根据企业的具体情况选用。

案例 预测模型一直都很准,直到……

这是个养殖行业的龙头企业,年营收在几百亿元。养殖需要饲料,饲料需要大宗的玉米、豆粕和各种辅料。养猪、养牛、养羊在中国已经有几千年的历史,但真正成气候却是最近一二十年的事:随着养殖业的工业化,行业的头部企业呈现爆炸式成长。过程也不是一帆风顺的:养殖业是个周期性行业,比如养猪是两年好两年坏;各种瘟疫不断,疯牛病、非洲猪瘟、猪流感你方唱罢我登场;肉价、粮价也影响存栏量,而存栏量直接影响对饲料的用量。这些都成为需求预测的大挑战。

预测准确度低,最终都是通过堆积更多的库存来应对的。国内的那些养殖巨头们,每年对玉米的需求都以几百万吨计,手头库存动辄几十万吨,如果能降低1周的库存,每年光利息节省就数以千万元计。

对案例企业来说,存栏量连年增长,企业每年都在增建养殖场,对玉米的需求呈上升趋势。玉米的市场价格变动,替代品的价格变动,养殖业的季节性,都给玉米的需求带来更多的变动。看上去这一切都很难预计,其实未必。我找到他们过去5年多的需求历史(从2015年第4季度开始),用计划软件来模拟,建立了相当不错的模型,拟合度相当高,如图1-17所示。

图1-17 玉米的需求历史和需求预测

这就是说,需求虽然一直在变,但并不意味着没法预测。这种趋势和季节性体现在数据中了,我们就能找到合适的预测模型来模拟。这里的预测模型是霍尔特-温特指数平滑法,能够相当贴切地反映玉米用量中的趋势和季节性,感兴趣的读者可以在百度自行搜索,从而进一步理解这个预测模型——这里的重点不是介绍这个模型,这里想说的是,模型与数据的拟合度一直非常高(绝对平均偏差只有5.3%),为什么到了2020年下半年,预测继续上扬,而实际需求却断崖式下跌,出现了大错特错?

这背后一定发生了显著改变需求的事,那就是玉米价格的飙升。如图1-18所示,过去五六年里,玉米的均价一直在两千多元一吨,虽然整体呈现上升趋势,但增速相对平缓,未能对玉米的需求造成显著影响。但是,2020年下半年,玉米的均价飙升40%左右,一度跨过每吨3000元的大关。玉米太贵,那就用别的饲料来替代,玉米的需求就大幅下跌了。

图1-18 玉米采购均价走势图

注:图中纵轴的具体价格是案例企业的公司信息,特意省去。

案例企业有专门的团队,分析大宗原粮的供求关系、价格走向,制定采购战略。他们要应对两个预测:其一,业务量变动带来的需求变动,比如存栏量的增加、新增养殖场带来的更多需求;其二,大宗原粮的市场价格变动。结合两者,来决定每种原粮要采购多少,是增持还是减持库存。

在这里,业务量对饲料的总体需求有根本性影响:存栏量越大,就需要越多的饲料,也就需要采购越多的原粮,不管是玉米、大豆还是小麦、高粱。但这只解决了一半问题,那就是总量。至于细分到具体的原粮上,分别买什么,买多少,却取决于市场价格。比如玉米的价格太高,小麦的价格尚可的话,就少买玉米而多买小麦;反之亦是。

正常年份,不同原粮的价格关系相对稳定,价格对需求的影响相对有限,所以我们用时间序列 模型,就能相当准确地预测玉米的需求。但是,在2020年,全球疫情、自然灾害等,造成玉米的供应不能满足需求,价格飞涨。这里的挑战就是预测价格走势,及时调整需求预测和采购量。

案例企业跟大宗原材料打交道多年,有相当丰富的经验,相当准确地预计到玉米的价格会飙升,就在2020年6月大幅买进。不过当我问他们的原粮采购负责人,价格走向好不好预测时,他说非常难,这正是让他的团队绞尽脑汁的地方。当然,我也是明知故问:如果好预测的话,那他们不早就改行做期货了,还用得着辛辛苦苦做养殖吗?

那价格怎么预测?你首先想到的就是数据分析:不管是股票还是大宗原材料,最不缺的就是历史数据。那好,我们把玉米均价输入预测软件,60多个月的数据,让软件来帮我们优化,推荐最合适的预测模型,来预测下个月的均价。软件分析的结果是,最好的模型是简单指数平滑法,平滑系数是1。“翻译”过来就是,用上个月的价格作为下个月的预测。

这样的预测不用软件你也会。软件其实是告诉你,历史价格没有规律性,虽然看上去有趋势,周期性变动,但这对预测明天的价格没有任何意义。比如现在是2021年3月,要预测4月、5月的价格,是高还是低,高多少、低多少,很困难,否则炒股、炒期货不都发财了嘛。

预测价格是永远跟无限的不确定性打交道。记得新冠肺炎疫情期间,美国股市连续几次熔断,标准普尔500指数下跌30%多。2020年3月23日,我跟财务顾问开电话会议讨论,我还有少许现金,想抄底进场,但我太太在旁边要跟我“拼命”,财务顾问也不确定股市下一步会怎么样。就这样,我们错过了抄底的最佳时机:“底”就是那一天的上一个交易日,最佳的“抄底”日期就是那一天。不过我一点也不觉得可惜:价格每天都有巨大的不确定性,预测的难度异常大。

那不确定性非常大时,究竟该怎么办?答案你知道:靠判断。就拿案例企业来说,每个月他们都做大宗原粮的需求、供给分析,然后就开会,几个最有经验的人坐在一起,群策群力,“拍脑袋”判断价格走向,指导后续的采购。但问题是,常见的会议方式不是群策群力的最佳方式:职位高的会影响职位低的,强势职能会影响弱势职能,还不说职能之间藏着掖着,互相博弈。我们要找更好的方式,那就是下面要讲的德尔菲专家判断法。

不确定性高时,群策群力避免大错特错

德尔菲专家判断法最早起源于第二次世界大战后期。当时美国空军要开发新的武器,但正因为是新武器,你不知道你不知道的。武器要达到什么性能,开发周期有多长,成功概率有多高,都充满不确定性。于是,军方就召集各方面的专家,群策群力,判断新技术的走向,指导新武器的开发。

或许有人会说,我们不是每天都在这么做嘛,不然那一个接一个的会议在干什么?不是的。与一般的专家会议不同,德尔菲专家判断法有三大独特之处: (1)专家判断;(2)匿名、背靠背;(3)多轮反馈和修正 。这减小了公司政治和“随大流”等因素的影响。

专家 指的是对判断对象有判断能力的人,而不是我们通常的领导或者职能专家。比如对具体的产品,具体的设计人员、产品经理往往比设计老总、销售老总们更有判断能力。相比之下,德尔菲专家判断法更加客观,因为是专家独立做判断,集体冒进的风险更低。而通常的高管会议呢,则经常变成了“免责会议”,在群体决策的机制下,企业更容易冒险,承担更多本来不应该承担的风险。

匿名、背靠背 的好处是参与者不用担心“对号入座”,大家独立做判断,避免了职位高的人对职位低的人、强势职能对弱势职能的影响,而这正是通常的会议不具备的。试想想,不管一个组织多民主,氛围多宽松,老总坐在那里,大家的思路总会自觉不自觉地跟着老总走,很难做到真正的群策群力。在公司政治的影响下,大家都藏着掖着,怕丢自己的面子,也怕丢别人的面子。在德尔菲专家判断法里,每个专家背靠背,以匿名的方式独立判断,就不存在这些问题。

多轮反馈和修正 是指组织者征集每个专家的判断及其依据,以匿名的方式汇总,反馈给每个专家组成员,让他们参考,调整下一轮判断。这促进了专家团队的信息对称,提高了决策质量,直到最后达成共识,或者达到预先设定的门槛,比如重复了多少轮。

“三个臭皮匠,能顶一个诸葛亮”,德尔菲专家判断法可以说是“智慧在民间”的体现。对于 同一事物 ,不同的人从不同的侧面有一定的认知,把这些认知整合到一起,就得到更全面、更好的认识。对这一点我深有体会:以前老东家为了进入新的领域,开发了N个新产品,都失败了,而且很早就知道会失败,因为你到餐厅里去,人人都在窃窃私语说会失败。这些人从不同角度,或多或少对新产品有一定的了解,整合到一起,就能看出清晰的方向来。

我在培训中,经常用一个集体游戏来说明这一点:我拿出一堆糖来,装在一个透明的大罐子里,足足有几百块,现场让大家来猜有多少块,各自扫描二维码填写。刚开始猜的时候,前几个人的平均值变动很大,误差也很大;一旦有接近10个人猜了,平均值的准确度就相当高,轻而易举达到70%以上——要知道,在需求预测中,70%可以说是个大关,很多企业都过不去;等十几个、二十个人以及更多的人报了数据上来,准确度就到了百分之八九十乃至更高。

这些人都是第一次猜,而且是只看一眼就猜,不允许他们仔细去数。有的人猜得高,有的人猜得低,平均后就更接近真实值。这在数理统计上也有依据,就是“大数定律”:用我们外行人的话讲,就是样本的数量越大,样本的平均值就越接近真实的平均值。放在专家预测上,就是 多人预测减小了误差,往往比单个人的预测更准确 。这是集体智慧战胜个人英雄主义。就如《超预测:预见未来的艺术和科学》一书中说的,(在预测上)一个人要打败多个人,需要有很强的能力和相当的训练,意味着交了很多学费,试了很多错;一群人要打败一个人,则不需要多少专业知识和训练(见图1-19)。

图1-19 个人能力与集体智慧的较量

对于不确定性很大的情况,比如新产品、新项目、大型的促销活动、长周期物料的预测,德尔菲专家判断法提供了一个很好的工具,让我们更有效地整合团队智慧,更稳定、更可靠地做好决策。这也是在下面的新品预测案例中,用跨职能团队代替个人预测的原因。

那是我跟一个快时尚电商做的一个案例,用德尔菲专家判断法预测上新期间的销量。快时尚电商面临的是一个充满不确定性、充满挑战的典型环境:案例企业做女孩子的服装,时效性强,生命周期短,需求直上直下,基本没有成熟期,预测本来就非常难做;电商环境下,上新期间,各种社交媒体的造势活动,更增加了需求的不确定性。再加上服装行业看上去简单,其供应链却一点也不简单,从原材料到半成品再到成品,动辄需要3个月的时间,一旦初始预测失败,几无返单的机会。

没有好的预测方法论,预测的风险太大,谁都不敢做预测,案例企业就只能靠老板做预测,因为只有他能够承担预测失败的风险,但短缺和过剩的问题并没有解决。作为解决方案,我们导入德尔菲专家判断法,组成有产品经理、设计师、门店经理、老总等7人的专家团队,预测一个新品在上新期间的初始销量。经过两轮循环,以专家团队的平均值作为预测,准确度达到90%以上。

这是个一万多字的案例,有很多细节,我已经纳入《需求预测和库存计划:一个实践者的角度》一书中(第230~241页)。大家也可扫描右边的二维码,在我的微信公众号“供应链管理专栏”中阅读。案例详细地阐述了如何选择合适的专家,问合适的问题,提供合适的背景信息,用在合适的产品上,用合适的方法统计结果,以及德尔菲专家判断法的结果是否有约束力,这一流程该由哪个职能维护等。

我想补充的是,越是简单的方法,越要精心设计,否则很容易垃圾进、垃圾出,流于形式。德尔菲专家判断法看上去很简单,但想成功实施,有三点要特别注意。

第一,德尔菲专家判断法不是“拍脑袋”,也得严格遵循“从数据开始,由判断结束”的决策流程 。就如这个快时尚电商的案例中,虽然这款衣服是新品,没有销售历史,但案例企业销售过类似的服装,还是有一定的可参考性。于是我们把上一年上新的6个可参考的产品找出来,统计上架30天、60天、90天的销量分别是多少;相比那6个产品,这个产品的定位、定价有何不同,以及有多少后续产品的上市计划等。

专家之所以是专家,主要是因为他们有类似产品的经验,而这些经验有相当一部分已经固化在需求历史中了。不过试想想,如果我们不把这些信息找出来,专家们会不会去系统地找?不会的:他们都是一帮忙人,帮助做计划是他们的兼职;有些人像设计,不怎么跟ERP打交道,根本不知道这些信息在哪里。离开了具体的信息,最终就变成单纯地“拍脑袋”。虽然多人“拍脑袋”比一人强,但还是改变不了“拍脑袋”的本质。

此外,为了防止专家简单地“拍脑袋”,我们要求专家不但做判断,而且要讲“故事”,罗列判断背后的假设和依据。要知道,作为判断,其“故事”比数据更重要,也往往更有参考价值。

第二,德尔菲专家判断法不能做成高管的评审会、跨职能的免责会 。在组建专家团队时,常犯的错误有二:(1)把各部门的高管纳入,这些人虽然是各自职能方面的专家,但对于具体的产品往往介入有限,判断能力不足;(2)每个职能都纳入代表,而有些职能比如财务、采购、质量对需求预测所知有限,判断能力也有限。这是典型的“免责会”做法:你们各个职能都参与了,老总们也在,以后出了问题可不要怪我噢。这是传统的会议方式的延续,并不能提高决策的质量;相反,因为缺乏产品层面的判断能力,有些“专家”反倒稀释了决策质量。

我发现,在管理粗放,动辄要老总审批的企业,容易犯第一个错误。比如在一个新能源企业,他们设计的专家团队就包括每个职能的负责人、各个城市子公司的老总等。在跨职能协调困难、协作度低的企业,比较容易犯第二个错误。比如有一家工业品企业,虽然是上市企业,但传统的老国有企业的作风仍然浓厚,他们设计的专家团队无所不包,从项目经理到研发工程师、产品经理、销售经理,再到产品计划工程师、策略采购工程师、执行采购工程师,甚至财务经理、制造工程师和售后工程师也有一席之地。这都是群体决策做法的变种,不是德尔菲专家判断法。

第三,德尔菲专家判断法不能做成一锤子买卖,而要建立闭环改进机制 。不确定性很高的场景,不管是全新产品的上市,还是显著改变需求的促销活动,并不是每天都发生的。这容易让大家产生误解,认为德尔菲专家判断法是应对那些一次性事件的。其实我们是一个又一个地导入新产品,一次又一次地做促销,无非是间隔时间比较长,远非一次性事件了。所以,我们要不断改善德尔菲专家判断法,让它成为我们工具箱里的常用工具。这需要通过反馈机制,从过往项目的失败中学习。

但问题是,德尔菲专家判断法的周期较长,给闭环管理带来挑战。就上面的快时尚电商案例来说,初始预测要在3个月以前做,那是由供应周期决定的;获得上新首月的销量又用掉一个月,那就意味着从做出预测,到结果出来,前后有4个月的周期,大部分专家估计都把这产品给忘了,因为其间他们已经开发了更多新品。这里的关键是,作为组织者,要有始有终,总结经验教训,比如召集短平快的会议,或者组织简单的聚餐,把这些信息反馈给专家团队,帮助核心专家们更好地掌握这一方法论。缺乏有效的反馈和学习,德尔菲专家判断法就“有教训,没经验”,没有实质性的改进,判断质量不高,就很容易倒退回原来的方法,比如老总做计划,内部用户提需求。

实践者问

如果说计划是一群人的智慧,错得最少,那结果不好时怎么追责?

刘宝红答

如果已经是最好地整合了历史经验和对未来的预判,那么计划错了就错了,那是生活的一部分。业务目标没实现,销售拿不到他们的提成,计划没了相应的奖金,这都是自然追责,我不认为需要额外的追责。

这是基于共识的预测的精髓。这里的关键是从数据开始,由判断结束,消除信息不对称,在对称信息的基础上,做出最好的决策,失败的话就失败了。用著名橄榄球教练贝尔·布莱恩的话说,那就是承认错误,汲取教训,不要再犯。

实践者问

德尔菲专家判断法需要多长时间?市场老总要敲定明年的销售目标,他认为德尔菲专家判断法是个好办法,要我们下周递交专家的意见。

刘宝红答

对于规模较大的企业,首次应用的话,周期应该在三四个星期左右:第一个星期培训方法论;第二个星期确定判断的问题,组织专家团队,搜集和整理背景资料;第三个星期再次培训专家团队,解释方法论,解释数据,熟悉数据,做第一次判断;第四个星期汇总第一次判断的结果,匿名反馈给团队,做第二次、第三次判断。时间太少,组织者、专家团队没法消化,效果欠佳,解决不了问题,反倒影响这个重要方法的推广。

德尔菲专家判断法看上去简单,其实是个重武器,因为涉及跨职能部门。越是简单的方法,越需要精心的设计。它不是简单地把几个人叫到一起,开个会那样简单。初次应用的时候,至少给专家团队三次机会接触:第一次是初始培训,让大家有初步的了解;第二次是介绍要做的项目,顺便再温习一下方法论;第三次是分发项目背景数据,结合具体的项目再一次介绍整个方法论。

这位实践者一再问:能否更快点?他们在做年度计划,包括一些影响深远的决策。当然可以更快一点,不过风险是欲速则不达。很多企业为了赶时间,就经常性地陷入“从来没有时间一次把事情做好,但总有时间两次、三次把事情做好”的怪圈。

就拿这个企业来说,他们想借助德尔菲专家判断法,预测3个已有系列、1个全新系列产品的年度销量。4个产品系列,线上、线下业务并存,这意味着有8个数据点,要判断的内容太多,特别是在行业发生巨变的情况下,有很多变量要考虑,很难有人能够对付这么多的问题,做出高质量的判断。

为了降低实施难度,我帮助他们简化为三个独立的判断,亦即三个项目,因为专家团队不同:(1)3个老产品系列,线上销量预测;(2)3个老产品系列,线下销量预测;(3)1个新产品系列的整体销量预测。线上和线下之所以分开,是因为专家虽有交叉,但不同。对于全新产品,尚无线上、线下的销售历史,那就整合到一起来预测。从该项目立项,到制订初步方案,再到我帮助他们简化方案,已经快两个星期过去了,这还不包括背景数据的收集、整理,专家团队的组建、培训等准备工作。再加上一轮、两轮的判断,至少又得两个星期,如果要做到位的话。

实践者问

新冠肺炎疫情期间,如何预测?

刘宝红答

新冠肺炎疫情增加了不确定性,需求和供应的不确定性都是,比平日更需要群策群力,以避免大错特错。类似的情况还有更多,比如大宗原材料的价格走势,半导体芯片的短缺状况等,都是德尔菲专家判断法的适用对象。 LzrgZTXtKpOWlmod8Zadh1smohcuY+zUlNBpfoN0M4J9qWACBmjgHWVbvWAIbmtq

点击中间区域
呼出菜单
上一章
目录
下一章
×