供应链的三道防线：需求预测、库存计划、供应链执行（第2版）最新章节_刘宝红著

“平时”与“战时”：两类典型的需求预测问题

根据不确定性的大小，我们可以把预测分为两类情况，如图1-14所示：“战时”的不确定性大，要避免大错特错；“平时”的可预见性高，要追求精打细算。

“战时”指不确定性很大，历史数据很少甚至没有的情况，比如新产品上市、“双11”备货等。没有太多可参考的数据，人们就习惯于找专家判断，让销售、市场、产品经理等“拍脑袋”，容易出现大错特错。一个解决方案呢，就是德尔菲专家判断法：群策群力，整合跨职能、跨阶层的最佳判断，提高首发命中率， 避免大错特错 。

“平时”指历史数据较充分，需求的可预见性比较高的情况，比如成熟产品的需求。企业的大多数业务属于此列，但管理者的注意力集中在第一种情况，此类业务就交给基层人员，凭经验计划，这是另一种形式的“拍脑袋”。对于解决方案，我们要借助数据模型和数理统计， 精打细算、精益求精 ，以求交付和库存周转的最优化。

图1-14　“平时”与“战时”两类不同的预测问题

需求相对稳定时，选用数据模型来精打细算

先说个哲学性的话题：为什么可以预测？我们之所以能够预测，是基于：（1）时间序列的 延续性 （也叫连贯性）；（2）变量之间的 相关性 （也叫类推性）。也就是说，发生过的跟尚未发生的有某种关系。

当需求的不确定性很高时，不管是延续性还是相关性，我们都不容易量化。但是，我们的头脑是最复杂的“AI”系统，能够建立变量之间非线性、难以描述的联系，这就是凭经验、“拍脑袋”。我们找有经验的人，就是因为他们的头脑里沉淀有更多的数据，他们的脑细胞也更可能让他们建立起这样的联系。

当需求的不确定性低时，特别是有了一定的需求历史后，历史与未来的延续性、相关性更容易建立，反映在一些简单而实用的模型中，这就是我们这里要讲的数据分析和数据模型。计划者的任务，就是找出和应用这样的关联性（预测模型），对未来做出预判，指导供应链执行来提前准备。

相关性 指变量之间存在的关系，可以类推。比如促销预算越高，买的广告、流量越多，产品的销量一般也会越高；预售期卖得好的产品，正常销售一般也会卖得好；在试点区卖得好的产品，在所有区域也会卖得不错。我们常说不怕不识货，就怕货比货，这“货比货”就是基于相关性，在数据有限的情况下，比如新产品的预测中，扮演重要角色。小步快走、尽快纠偏，也是通过有限时间、有限客户的需求，来推断整体的需求预测，其后的逻辑也是相关性。

你现在知道了，让营销判断，其实是借助他们以往的经历，比如以前做促销的时候，花了多少钱，买了多少流量，卖掉多少产品，来判断这次花多少钱，能卖多少货。这不是单纯地“拍脑袋”，这也是以数据分析为基础。试想想，每次做活动、要预算的时候，营销也得拿出点数据给老总，来证明为什么要100万元而不是60万元的预算。用得比较多的逻辑呢，就是相关性。

对于相关性，我们常用的模型就是线性回归法，即变量之间存在一定的线性关系，线性回归根据变量的多少又分为一元、二元、多元线性回归。线性回归听上去很高大上，其实我们每天都在用：投入多，产出就多，就是基本的线性回归思路。线性回归涉及一些基本的数理统计，在我的《需求预测和库存计划：一个实践者的角度》一书中有详细的描述（第57～77页），这里就不再重述。

延续性 体现在时间序列中，就是呈现一定的模式（见图1-15）：（1）趋势——随着时间发展，需求呈现上升或者下降的趋势；（2）周期性——需求呈现交替性的波峰、波谷，季节性就是其中一种；（3）随机变动——在外界因素的影响下，需求展现出忽高忽低的变化，但整体上平稳。

如果只看图1-15中的实际值，我们是很难预测未来需求的。但当我们把其中的趋势和季节性分解出来以后，就找到了数据中的大部分规律：趋势是可以预测的，季节性也是。剩余部分就是残余，亦即趋势和季节性数据模型没法解释的部分，我们把它归因于随机因素，一般依赖安全库存、供应链执行来应对。

图1-15　时间序列的分解示意

这些随机变动中，真正可能“害死”我们的是那些为数不多的波峰、波谷：前者可能造成短缺，后者可能导致过剩。说是随机，其实很多波峰、波谷不是随机产生的，而是因为发生了一些能够显著改变需求的行为，有些是客户驱动的，有些是我们自己主导的，有些由竞争对手导入——当我们不知道背后的驱动因素的时候，就把它们归之为“随机”。这就需要销售、产品、客户端的判断，对那些没发生但有可能发生的促销、活动、产品切换、市场竞争、政策变动等提前预判，完成需求预测的“由判断结束”。

看得出，对于这样的时间序列，大部分的预测工作通过数据模型即可完成，只有很少的部分需要判断。在需求计划薄弱的企业，计划往往没有能力提取需求历史中的规律性部分，于是就不分青红皂白地依赖一线销售提需求，耗费了一线的大量资源，反倒让一线没法聚焦那些真正需要管理的内容。结果就是既做不到“从数据开始”，也做不到“由判断结束”，预测准确度低下也就不难理解了。

对于图1-15中的随机变动、趋势和周期性，我们有相应的预测模型，下面予以简单介绍。

当需求没有明显的趋势、季节性的时候，我们认为变动主要是随机的，可以用 移动平均法 和 简单指数平滑法 来预测。这是两种最简单，应用也最广泛的预测模型，特别是后者。

移动平均法就是用过去一段时间的需求，求平均值，作为下一期的预测。当每期的权重相同时，叫简单移动平均法；当权重不同时，就叫加权移动平均法。比如用简单移动平均法按照3个月进行预测的话，7月的预测就等于4、5、6三个月需求的平均值。这里的关键是：究竟用多长的需求历史？这是移动平均法的择优，一般用复盘的方式来确定。比如我们已经知道最近13周每周的实际需求，我们可以用更老的需求历史，来复盘预测过去13周的需求，看3周移动平均的误差最小，还是6周或8周，等等。具体的操作，以及如何计算预测误差，评估预测准确度，在我的《需求预测和库存计划：一个实践者的角度》一书中有详细的描述（第13～17页）。

简单移动平均法假定每期的需求历史占比相同。这并不一定对，因为直觉告诉我们，最新的需求历史往往更有参考性。这就衍生出加权移动平均法，比如上一期的权重是30%，倒数第二期的为25%，倒数第三期的为20%等，所有权重加起来等于1。至于权重如何分配，这又是模型择优的任务，可通过计算不同权重分配下的预测准确度来确定。

你马上发现，看上去很简单的移动平均，其实要用好的话，一点也不简单：我们得确定用多长的需求历史（也就是我们通常说的，多长的需求历史有代表性），我们还得确定权重分配。在实际应用中，很多企业都是靠经验，选定一定时长的需求历史，要么简单平均，要么加权平均，当然是有优化完善的空间的。

我们接着介绍的 简单指数平滑法 ，其实是一种特殊的加权平均法：权重以几何数级衰减，越近的需求历史权重越大，越远的权重越小。究竟权重多大，衰减的速度多快，取决于平滑系数。该系数介于0～1，取值越大，最新需求历史的权重越大，预测模型越灵敏；取值越小，权重的衰减速度越慢，预测模型也越稳定。

在操作上，简单指数平滑法只用两个数据点：上期的实际值、上期的预测值，下期的预测是这两个值的加权平均。这逻辑就如踢足球：如图1-16所示，作为防守队员，你得预测下一步往哪儿跑——你是由预测驱动的，这取决于球现在停在哪里（上一期的实际值），以及你现在停在哪里（上一次的预测值）。有两个极端：一个是球跑到哪儿你就跟到哪儿，也就是百分之百地用上次的实际值作为预测值（平滑系数=1）；另一个是不管球在哪儿，你按照你的老战略，也就是百分之百地沿用上次的预测（平滑系数=0）。你知道，两个极端都会让你输得很惨，你得在两者之间寻求平衡，这就是简单指数平滑法的择优，通过选择合适的平滑系数来实现。

图1-16　简单指数平滑法的逻辑就如防守队员的防守逻辑

跟移动平均法的择优逻辑一样，我们一般用复盘的方式，摘取一段有代表性的需求历史，用更老的数据来复盘预测，计算不同平滑系数下，每种简单指数平滑法的准确度，选择预测准确度最高，也就是预测误差最小的方法。

简单指数平滑法听上去很玄妙，其实操作起来很简单，自20世纪50年代发展起来以后，已经相当成熟。我们这里不再赘述方法论本身，我想说的是，为什么简单指数平滑法那么重要。

简单指数平滑法好，是因为逻辑上它更符合实际情况，比如越近的需求历史越有参考价值。这很重要，意味着它能更快地捡起新近发生过的事，及时更新预测。比如销售在前端做促销，但没有告诉你，而简单指数平滑法一看昨天的需求高了，就建议你今天多补些货过去。再比如你的生产线上昨天有个关键备件坏了，这种备件很少坏，属于典型的长尾，而它现在坏了，可能意味着这批设备开始老化，相应地，简单指数平滑法会把这个信号及时纳入预测中，提醒你得注意多备货了。

简单指数平滑法好，还因为它“简单”：只需要平滑系数一个参数即可。我们通过调整平滑系数，就可优化预测模型。比如业务变动大的时候，平滑系数就更大；业务比较稳定的时候，平滑系数可取更小的值。整体上，这一方法比移动平均法的预测准确度更高。

或许有人会问，既然有“简单”指数平滑法，那就也有“不简单”的指数平滑法了？是的，这就是我们接着要介绍的霍尔特模型、霍尔特–温特模型——分别来预测趋势、趋势加季节性的模型。

我们知道，简单指数平滑法适用于没有明显的趋势、没有明显的季节性的情况。因为如果有的话，简单指数平滑法就会有系统性的偏差，比如需求有增长或下降趋势时，简单指数平滑法会一直偏低或偏高（移动平均法也是）。

时间长了，需求往往会呈现一定的模式，不再光是随机变动。比如你开了个新店，或者导入了新产品，随着时间推进，口碑越来越好，业务呈现一定的上升趋势；再比如很多业务有一定的季节性，这时就需要更合适的模型来预测。

当时间足够长的时候，季节性的因素就往往不可避免。这个世界上，很难找到没有季节性的需求。有的是自然因素驱动，比如寒暑易节，热饮冷饮的业务交替变化，电力消耗、煤气消耗的变化；有的是人为因素驱动，比如季度考核导致季末冲量，6·18、“双11”等大促销。甚至连有些政府项目也有季节性：前半年走流程，审批预算；后半年做项目，突击花钱。

作为应对，霍尔特模型增加了一个平滑系数，来对付趋势问题；霍尔特-温特模型增加了两个平滑系数，一个应对趋势，一个应对季节性问题。

指数平滑法非常强大，还在于其 自适应性 。比如就趋势来说，我们可以用线性回归找出一条直线来模拟，其斜率是固定的，比较僵化；在霍尔特模型里，斜率本身是可调整的，我们用一条折线来模拟，拟合度自然要比一条直线高，预测准确度也更高。再比如我们常用的季节性模型中，季节性因子的权重是固定的（四个季度的权重加起来是1，但每个季度的权重是不变的）；霍尔特-温特模型中，我们有专门的平滑系数，来动态调整季节性因子，这都让模型的拟合度更高，预测准确度也更高。

现在，我们在指数平滑法体系内，有了三类模型，能对付我们遇到的大部分需求预测问题，不管是随机变动，还是趋势性变动，或是季节性变动。我们还可以调整相应的平滑系数，让这些模型更好地匹配实际业务。这也是为什么在预测领域， 指数平滑法是应用最广的方法 ，没有之一。在每一种计划软件里，你都能看到指数平滑法的影子，而且是主要的背景算法。人工智能、机器学习，也都离不开指数平滑法。

对于规律性的东西，没有人知道得比数据还多 。借助这些常用的预测模型，我们可以发掘数据中已知的规律，在预测上精益求精，优化交付和库存周转。当然，预测方法深似海，这里只是点到为止。更多的细节，比如指数平滑法的初始化，平滑系数的择优，实施中要注意的问题等，可参考我的《需求预测和库存计划：一个实践者的角度》一书。

此外，我还想强调三点。

其一，在预测方法上， 简单的模型往往比复杂的更有效，你能懂的模型往往强过你不懂的 。这里提到的移动平均法和指数平滑法，应该能够对付我们遇到的绝大多数问题。如果有人一开口就是傅里叶变换、机器学习、神经网络什么的，你得非常谨慎才对：那些都很重要，但它们更多的是喂饱你的第五个包子，你得先把简单的四个吃了。要选择合适的模型，避免系统和组织的两层皮问题：你没法理解的，就不会信任；不信任的话，就不会去用。

其二，预测模型要优化。优化本身并没有听上去那么难，一般是通过复盘，选择准确度更高的模型，Excel表里就可以做，关键是要做起来。这是计划职能可以独立控制的。对很多企业来说，通过简单的优化，把预测准确度提高几个百分点并不难——在预测方法的择优上，这些企业就如从没吃过药的原始人，只要给他们颗阿司匹林，就会有效果。可不要小看这几个百分点，那可能意味着几个百分点的净利润。

其三，预测模型知道它们知道的，不知道它们不知道的，所以一定要和职业判断相结合。请相信直觉： 如果模型的结果看上去不对，它十有八九是错了 。这是因为数据可能有问题，公式可能会套错，参数可能会选错，特别是在刚开始用模型的时候。业务和专业经验不可替代，这就是为什么不能光靠计算机来做计划。

实践者问

能把那些公式给我们，让我们写到程序里，来预测和补货吗？

刘宝红答

公式没什么特别，比如指数平滑法都是半个多世纪前的研究，从理论上讲相当成熟，也不难。要说难，难在两个方面：（1）数据模型的结果很大程度上取决于数据本身的质量，而数据清洗这样的事，没法完全交给公式或计算机；（2）数据模型完全依赖数据，知道它知道的，不知道它不知道的，即缺少了判断的成分。就这样，光靠公式，“从数据开始”有点勉强（因为数据清洗工作等欠缺），“由判断结束”则完全做不到。你知道，这样的计划结果不会理想。

对于上面介绍的简单指数平滑法、霍尔特模型、霍尔特–温特模型等一系列时间序列预测法，大家都可以到一个网站（ https://www.real-statistics.com/free-download/ ）上下载成套的模板和公式。这个网站是Charles Zaiontz博士开发的。这个人堪称极客般的存在，能把复杂的数理统计解释得非常清楚。

小贴士计划软件往往优于人工，为什么不被采用

我接触过几个软件公司，都是开发计划软件的。它们有的基于数理统计，提供多种预测模型以供择优选用；有的基于人工智能，通过机器学习，为需求预测和库存计划提供独特的解决方案。这些软件都远非完美，不过整体而言，要比一帮计划员“拍脑袋”、各行其是强。但是，很多企业就是不愿采用，或者即便实施了计划软件，实际工作中还是在Excel中手工做计划。

我想主要有以下几个原因。

其一，计划软件没法有效应对大错特错，比如上新、促销、需求变动等造成的预测准确度太低的问题。我们知道，一个好的预测是“从数据开始，由判断结束”：好的软件系统可以帮助我们精益求精，做好基准预测，解决好“三分技术”的问题，完成“从数据开始”，但“七分管理”的问题，比如销售与运营协调，由销售、市场、产品端提供判断，更好地调整基准预测，却并不是软件能够解决的，所以没法“由判断结束”。

计划软件的特长不是帮你打通跨职能壁垒，促进跨职能协作，而是帮你精益求精，把那些主要是数据驱动的计划做得更好。我们用错误的标准来衡量计划软件，当然会得到错误的结论。对于软件开发者来说，如果定位不清，把大量的精力花在解决组织、流程问题上，八成是浪费资源，在对着错误的那棵树汪汪叫。上帝的归上帝，凯撒的归凯撒：软件开发者要聚焦软件功能，应对数据分析，组织、流程问题是实施顾问们要对付的。

对于有些企业来说，因为整体运营实在粗放，还没有到精益求精的地步，它们其实没有能力上这样的计划软件，我倒是建议它们更多地发力组织、流程，促进销售与运营之间的协作，这样投资回报率或许更高。也就是说，先是组织流程，解决“七分管理”的问题；后是软件系统，改善“三分技术”的问题，如果不得不分先后顺序的话。对很多企业来说，改善计划的第一步不是上软件系统。用Excel也能做出不错的计划，如果“七分管理”的问题解决了的话。当然，“七分管理”做到了，避免大错特错的目的达到后，进一步就是追求精益求精，软件系统就不可回避。

其二，软件往往不能显著降低整体的库存水平。很多计划类软件把降低库存作为一大卖点，其实并非如此：好的计划软件一般会降低库存，但整体降幅往往并不显著；计划软件的更大价值在于改善库存结构，把合适的库存放在合适的产品上，在适度降低库存的同时，系统提高服务水平。让我们拿健身减肥来打比方说明。

跟健身减肥一样，库存控制分三个阶段。在初级阶段，库存很高，但客户要的没有，就如一身肥肉，都长在错误的地方——肚子上，结果是高库存、低有货，这是很多公司的起点。然后开始健身，整天跑步、举铁，一段时间下来，上秤一称，很失望地发现，体重并没多大变化，甚至增加了。想想看，整天锻炼，胃口更好了，吃得更多了，体重能减轻吗？但是，你也会注意到，你的身体更加匀称，肉长到合适的地方去了。这就到了高库存、高有货阶段。那就接着练，对自己更“狠”点，改变饮食结构，生活更节制，一点点把那些肥油给练下来，肌肉更多了，体重也下来了，这就到了低库存、高有货的第三阶段。

在这个三阶段“健身减肥”过程中，计划软件通过提高预测准确度、设置更合理的安全库存，把合适的库存放到合适的产品上，改善了粗放经营下，过剩和短缺并存的情况。可以说，计划软件主要在做第二阶段的事，实现高库存下的高有货。那怎么才能到达第三阶段呢？这就得回到库存的三大根源：周转周期、不确定性和组织行为，通过缩短周转周期来降低周转库存，减小需求和供应的不确定性来降低安全库存，以及改变组织行为来降低多余库存，这些我们在后文还会详细阐述。这需要营销、生产、采购和供应链的整体协作，更多的是个执行问题，而非计划和计划软件能应对的——计划软件更多的是准确地量化，但不是改变这些库存的根源。

其三，系统和组织两层皮，计划人员不愿放弃控制。这有点费解，简单地说，就是软件虽然很好，但由于各种因素很难用，计划的结果不可靠；或者其中的逻辑复杂，计划人员没法理解，不理解就不信任，不信任就自然不用。两者都导致系统和组织两层皮，即便上了计划软件，计划人员还是我行我素，继续在Excel表上做“道场”，计划软件就沦为上载计划结果，跟ERP对接的接口。

要知道，凡是计划软件，如果要得到可靠的结果，都要求清洗数据，比如把那些没有重复性的或者有错误的数据清理掉。这很费事，要做好的话，会占用相当多的时间。很多企业没有决心，也就没有资源把这事儿做好，结果就是“垃圾进”，注定也是“垃圾出”，对于计划软件的建议，计划团队当然不信，自然也不会去采用，软件系统就成了摆设。这是系统和组织两层皮的原因之一。

另一个原因呢，就是软件中的很多逻辑，比如预测模型的原理和择优，计划人员根本就不理解。数理统计虽然客观，但冷冰冰，很少有人真正理解。对于自己不理解的，我们自然没法信任，会感觉失控。人是追求确定性的，不光是结果的确定性，更重要的是过程的确定性，这都导致软件不被使用。

再加上设计这些逻辑的人呢，往往是一些IT背景的。我不想冒犯IT人员，但这真的不是他们的专长，他们只能生搬硬套一些公式。计划人员虽然不懂这些逻辑，但一眼就能看出，软件系统做出的计划并不靠谱，当然就不会去用了。在一个新零售企业，IT系统建议的采纳率不足30%，我们也不能抱怨业务人员不采纳。这种情况下，我是宁肯一线提需求，因为他们提需求做不到精益求精，但更可能避免大错特错。系统建议呢，则是盲人骑瞎马，造成灾难的可能性更大。

实践者问

我们在用某ERP软件自带的计划模块来做预测，发现功能不齐全，用户友好性也差。怎么办？

刘宝红答

计划模块不是ERP软件公司的主业，也不是他们软件的卖点。这就如你到大酒店里，让他们做个鸡蛋灌饼给你吃一样，他们可能不做，如果做的话也一定没有街头小摊做得地道。那怎么办？我们得找专业的计划软件。市面上有一些这样的软件，各有利弊，得根据企业的具体情况选用。

案例预测模型一直都很准，直到……

这是个养殖行业的龙头企业，年营收在几百亿元。养殖需要饲料，饲料需要大宗的玉米、豆粕和各种辅料。养猪、养牛、养羊在中国已经有几千年的历史，但真正成气候却是最近一二十年的事：随着养殖业的工业化，行业的头部企业呈现爆炸式成长。过程也不是一帆风顺的：养殖业是个周期性行业，比如养猪是两年好两年坏；各种瘟疫不断，疯牛病、非洲猪瘟、猪流感你方唱罢我登场；肉价、粮价也影响存栏量，而存栏量直接影响对饲料的用量。这些都成为需求预测的大挑战。

预测准确度低，最终都是通过堆积更多的库存来应对的。国内的那些养殖巨头们，每年对玉米的需求都以几百万吨计，手头库存动辄几十万吨，如果能降低1周的库存，每年光利息节省就数以千万元计。

对案例企业来说，存栏量连年增长，企业每年都在增建养殖场，对玉米的需求呈上升趋势。玉米的市场价格变动，替代品的价格变动，养殖业的季节性，都给玉米的需求带来更多的变动。看上去这一切都很难预计，其实未必。我找到他们过去5年多的需求历史（从2015年第4季度开始），用计划软件来模拟，建立了相当不错的模型，拟合度相当高，如图1-17所示。

图1-17　玉米的需求历史和需求预测

这就是说，需求虽然一直在变，但并不意味着没法预测。这种趋势和季节性体现在数据中了，我们就能找到合适的预测模型来模拟。这里的预测模型是霍尔特-温特指数平滑法，能够相当贴切地反映玉米用量中的趋势和季节性，感兴趣的读者可以在百度自行搜索，从而进一步理解这个预测模型——这里的重点不是介绍这个模型，这里想说的是，模型与数据的拟合度一直非常高（绝对平均偏差只有5.3%），为什么到了2020年下半年，预测继续上扬，而实际需求却断崖式下跌，出现了大错特错？

这背后一定发生了显著改变需求的事，那就是玉米价格的飙升。如图1-18所示，过去五六年里，玉米的均价一直在两千多元一吨，虽然整体呈现上升趋势，但增速相对平缓，未能对玉米的需求造成显著影响。但是，2020年下半年，玉米的均价飙升40%左右，一度跨过每吨3000元的大关。玉米太贵，那就用别的饲料来替代，玉米的需求就大幅下跌了。

图1-18　玉米采购均价走势图

注：图中纵轴的具体价格是案例企业的公司信息，特意省去。

案例企业有专门的团队，分析大宗原粮的供求关系、价格走向，制定采购战略。他们要应对两个预测：其一，业务量变动带来的需求变动，比如存栏量的增加、新增养殖场带来的更多需求；其二，大宗原粮的市场价格变动。结合两者，来决定每种原粮要采购多少，是增持还是减持库存。

在这里，业务量对饲料的总体需求有根本性影响：存栏量越大，就需要越多的饲料，也就需要采购越多的原粮，不管是玉米、大豆还是小麦、高粱。但这只解决了一半问题，那就是总量。至于细分到具体的原粮上，分别买什么，买多少，却取决于市场价格。比如玉米的价格太高，小麦的价格尚可的话，就少买玉米而多买小麦；反之亦是。

正常年份，不同原粮的价格关系相对稳定，价格对需求的影响相对有限，所以我们用时间序列模型，就能相当准确地预测玉米的需求。但是，在2020年，全球疫情、自然灾害等，造成玉米的供应不能满足需求，价格飞涨。这里的挑战就是预测价格走势，及时调整需求预测和采购量。

案例企业跟大宗原材料打交道多年，有相当丰富的经验，相当准确地预计到玉米的价格会飙升，就在2020年6月大幅买进。不过当我问他们的原粮采购负责人，价格走向好不好预测时，他说非常难，这正是让他的团队绞尽脑汁的地方。当然，我也是明知故问：如果好预测的话，那他们不早就改行做期货了，还用得着辛辛苦苦做养殖吗？

那价格怎么预测？你首先想到的就是数据分析：不管是股票还是大宗原材料，最不缺的就是历史数据。那好，我们把玉米均价输入预测软件，60多个月的数据，让软件来帮我们优化，推荐最合适的预测模型，来预测下个月的均价。软件分析的结果是，最好的模型是简单指数平滑法，平滑系数是1。“翻译”过来就是，用上个月的价格作为下个月的预测。

这样的预测不用软件你也会。软件其实是告诉你，历史价格没有规律性，虽然看上去有趋势，周期性变动，但这对预测明天的价格没有任何意义。比如现在是2021年3月，要预测4月、5月的价格，是高还是低，高多少、低多少，很困难，否则炒股、炒期货不都发财了嘛。

预测价格是永远跟无限的不确定性打交道。记得新冠肺炎疫情期间，美国股市连续几次熔断，标准普尔500指数下跌30%多。2020年3月23日，我跟财务顾问开电话会议讨论，我还有少许现金，想抄底进场，但我太太在旁边要跟我“拼命”，财务顾问也不确定股市下一步会怎么样。就这样，我们错过了抄底的最佳时机：“底”就是那一天的上一个交易日，最佳的“抄底”日期就是那一天。不过我一点也不觉得可惜：价格每天都有巨大的不确定性，预测的难度异常大。

那不确定性非常大时，究竟该怎么办？答案你知道：靠判断。就拿案例企业来说，每个月他们都做大宗原粮的需求、供给分析，然后就开会，几个最有经验的人坐在一起，群策群力，“拍脑袋”判断价格走向，指导后续的采购。但问题是，常见的会议方式不是群策群力的最佳方式：职位高的会影响职位低的，强势职能会影响弱势职能，还不说职能之间藏着掖着，互相博弈。我们要找更好的方式，那就是下面要讲的德尔菲专家判断法。

不确定性高时，群策群力避免大错特错

德尔菲专家判断法最早起源于第二次世界大战后期。当时美国空军要开发新的武器，但正因为是新武器，你不知道你不知道的。武器要达到什么性能，开发周期有多长，成功概率有多高，都充满不确定性。于是，军方就召集各方面的专家，群策群力，判断新技术的走向，指导新武器的开发。

或许有人会说，我们不是每天都在这么做嘛，不然那一个接一个的会议在干什么？不是的。与一般的专家会议不同，德尔菲专家判断法有三大独特之处： （1）专家判断；（2）匿名、背靠背；（3）多轮反馈和修正 。这减小了公司政治和“随大流”等因素的影响。

专家指的是对判断对象有判断能力的人，而不是我们通常的领导或者职能专家。比如对具体的产品，具体的设计人员、产品经理往往比设计老总、销售老总们更有判断能力。相比之下，德尔菲专家判断法更加客观，因为是专家独立做判断，集体冒进的风险更低。而通常的高管会议呢，则经常变成了“免责会议”，在群体决策的机制下，企业更容易冒险，承担更多本来不应该承担的风险。

匿名、背靠背 的好处是参与者不用担心“对号入座”，大家独立做判断，避免了职位高的人对职位低的人、强势职能对弱势职能的影响，而这正是通常的会议不具备的。试想想，不管一个组织多民主，氛围多宽松，老总坐在那里，大家的思路总会自觉不自觉地跟着老总走，很难做到真正的群策群力。在公司政治的影响下，大家都藏着掖着，怕丢自己的面子，也怕丢别人的面子。在德尔菲专家判断法里，每个专家背靠背，以匿名的方式独立判断，就不存在这些问题。

多轮反馈和修正 是指组织者征集每个专家的判断及其依据，以匿名的方式汇总，反馈给每个专家组成员，让他们参考，调整下一轮判断。这促进了专家团队的信息对称，提高了决策质量，直到最后达成共识，或者达到预先设定的门槛，比如重复了多少轮。

“三个臭皮匠，能顶一个诸葛亮”，德尔菲专家判断法可以说是“智慧在民间”的体现。对于 同一事物 ，不同的人从不同的侧面有一定的认知，把这些认知整合到一起，就得到更全面、更好的认识。对这一点我深有体会：以前老东家为了进入新的领域，开发了N个新产品，都失败了，而且很早就知道会失败，因为你到餐厅里去，人人都在窃窃私语说会失败。这些人从不同角度，或多或少对新产品有一定的了解，整合到一起，就能看出清晰的方向来。

我在培训中，经常用一个集体游戏来说明这一点：我拿出一堆糖来，装在一个透明的大罐子里，足足有几百块，现场让大家来猜有多少块，各自扫描二维码填写。刚开始猜的时候，前几个人的平均值变动很大，误差也很大；一旦有接近10个人猜了，平均值的准确度就相当高，轻而易举达到70%以上——要知道，在需求预测中，70%可以说是个大关，很多企业都过不去；等十几个、二十个人以及更多的人报了数据上来，准确度就到了百分之八九十乃至更高。

这些人都是第一次猜，而且是只看一眼就猜，不允许他们仔细去数。有的人猜得高，有的人猜得低，平均后就更接近真实值。这在数理统计上也有依据，就是“大数定律”：用我们外行人的话讲，就是样本的数量越大，样本的平均值就越接近真实的平均值。放在专家预测上，就是 多人预测减小了误差，往往比单个人的预测更准确 。这是集体智慧战胜个人英雄主义。就如《超预测：预见未来的艺术和科学》一书中说的，（在预测上）一个人要打败多个人，需要有很强的能力和相当的训练，意味着交了很多学费，试了很多错；一群人要打败一个人，则不需要多少专业知识和训练（见图1-19）。

图1-19　个人能力与集体智慧的较量

对于不确定性很大的情况，比如新产品、新项目、大型的促销活动、长周期物料的预测，德尔菲专家判断法提供了一个很好的工具，让我们更有效地整合团队智慧，更稳定、更可靠地做好决策。这也是在下面的新品预测案例中，用跨职能团队代替个人预测的原因。

那是我跟一个快时尚电商做的一个案例，用德尔菲专家判断法预测上新期间的销量。快时尚电商面临的是一个充满不确定性、充满挑战的典型环境：案例企业做女孩子的服装，时效性强，生命周期短，需求直上直下，基本没有成熟期，预测本来就非常难做；电商环境下，上新期间，各种社交媒体的造势活动，更增加了需求的不确定性。再加上服装行业看上去简单，其供应链却一点也不简单，从原材料到半成品再到成品，动辄需要3个月的时间，一旦初始预测失败，几无返单的机会。

没有好的预测方法论，预测的风险太大，谁都不敢做预测，案例企业就只能靠老板做预测，因为只有他能够承担预测失败的风险，但短缺和过剩的问题并没有解决。作为解决方案，我们导入德尔菲专家判断法，组成有产品经理、设计师、门店经理、老总等7人的专家团队，预测一个新品在上新期间的初始销量。经过两轮循环，以专家团队的平均值作为预测，准确度达到90%以上。

这是个一万多字的案例，有很多细节，我已经纳入《需求预测和库存计划：一个实践者的角度》一书中（第230～241页）。大家也可扫描右边的二维码，在我的微信公众号“供应链管理专栏”中阅读。案例详细地阐述了如何选择合适的专家，问合适的问题，提供合适的背景信息，用在合适的产品上，用合适的方法统计结果，以及德尔菲专家判断法的结果是否有约束力，这一流程该由哪个职能维护等。

我想补充的是，越是简单的方法，越要精心设计，否则很容易垃圾进、垃圾出，流于形式。德尔菲专家判断法看上去很简单，但想成功实施，有三点要特别注意。

第一，德尔菲专家判断法不是“拍脑袋”，也得严格遵循“从数据开始，由判断结束”的决策流程 。就如这个快时尚电商的案例中，虽然这款衣服是新品，没有销售历史，但案例企业销售过类似的服装，还是有一定的可参考性。于是我们把上一年上新的6个可参考的产品找出来，统计上架30天、60天、90天的销量分别是多少；相比那6个产品，这个产品的定位、定价有何不同，以及有多少后续产品的上市计划等。

专家之所以是专家，主要是因为他们有类似产品的经验，而这些经验有相当一部分已经固化在需求历史中了。不过试想想，如果我们不把这些信息找出来，专家们会不会去系统地找？不会的：他们都是一帮忙人，帮助做计划是他们的兼职；有些人像设计，不怎么跟ERP打交道，根本不知道这些信息在哪里。离开了具体的信息，最终就变成单纯地“拍脑袋”。虽然多人“拍脑袋”比一人强，但还是改变不了“拍脑袋”的本质。

此外，为了防止专家简单地“拍脑袋”，我们要求专家不但做判断，而且要讲“故事”，罗列判断背后的假设和依据。要知道，作为判断，其“故事”比数据更重要，也往往更有参考价值。

第二，德尔菲专家判断法不能做成高管的评审会、跨职能的免责会 。在组建专家团队时，常犯的错误有二：（1）把各部门的高管纳入，这些人虽然是各自职能方面的专家，但对于具体的产品往往介入有限，判断能力不足；（2）每个职能都纳入代表，而有些职能比如财务、采购、质量对需求预测所知有限，判断能力也有限。这是典型的“免责会”做法：你们各个职能都参与了，老总们也在，以后出了问题可不要怪我噢。这是传统的会议方式的延续，并不能提高决策的质量；相反，因为缺乏产品层面的判断能力，有些“专家”反倒稀释了决策质量。

我发现，在管理粗放，动辄要老总审批的企业，容易犯第一个错误。比如在一个新能源企业，他们设计的专家团队就包括每个职能的负责人、各个城市子公司的老总等。在跨职能协调困难、协作度低的企业，比较容易犯第二个错误。比如有一家工业品企业，虽然是上市企业，但传统的老国有企业的作风仍然浓厚，他们设计的专家团队无所不包，从项目经理到研发工程师、产品经理、销售经理，再到产品计划工程师、策略采购工程师、执行采购工程师，甚至财务经理、制造工程师和售后工程师也有一席之地。这都是群体决策做法的变种，不是德尔菲专家判断法。

第三，德尔菲专家判断法不能做成一锤子买卖，而要建立闭环改进机制 。不确定性很高的场景，不管是全新产品的上市，还是显著改变需求的促销活动，并不是每天都发生的。这容易让大家产生误解，认为德尔菲专家判断法是应对那些一次性事件的。其实我们是一个又一个地导入新产品，一次又一次地做促销，无非是间隔时间比较长，远非一次性事件了。所以，我们要不断改善德尔菲专家判断法，让它成为我们工具箱里的常用工具。这需要通过反馈机制，从过往项目的失败中学习。

但问题是，德尔菲专家判断法的周期较长，给闭环管理带来挑战。就上面的快时尚电商案例来说，初始预测要在3个月以前做，那是由供应周期决定的；获得上新首月的销量又用掉一个月，那就意味着从做出预测，到结果出来，前后有4个月的周期，大部分专家估计都把这产品给忘了，因为其间他们已经开发了更多新品。这里的关键是，作为组织者，要有始有终，总结经验教训，比如召集短平快的会议，或者组织简单的聚餐，把这些信息反馈给专家团队，帮助核心专家们更好地掌握这一方法论。缺乏有效的反馈和学习，德尔菲专家判断法就“有教训，没经验”，没有实质性的改进，判断质量不高，就很容易倒退回原来的方法，比如老总做计划，内部用户提需求。

实践者问

如果说计划是一群人的智慧，错得最少，那结果不好时怎么追责？

刘宝红答

如果已经是最好地整合了历史经验和对未来的预判，那么计划错了就错了，那是生活的一部分。业务目标没实现，销售拿不到他们的提成，计划没了相应的奖金，这都是自然追责，我不认为需要额外的追责。

这是基于共识的预测的精髓。这里的关键是从数据开始，由判断结束，消除信息不对称，在对称信息的基础上，做出最好的决策，失败的话就失败了。用著名橄榄球教练贝尔·布莱恩的话说，那就是承认错误，汲取教训，不要再犯。

实践者问

德尔菲专家判断法需要多长时间？市场老总要敲定明年的销售目标，他认为德尔菲专家判断法是个好办法，要我们下周递交专家的意见。

刘宝红答

对于规模较大的企业，首次应用的话，周期应该在三四个星期左右：第一个星期培训方法论；第二个星期确定判断的问题，组织专家团队，搜集和整理背景资料；第三个星期再次培训专家团队，解释方法论，解释数据，熟悉数据，做第一次判断；第四个星期汇总第一次判断的结果，匿名反馈给团队，做第二次、第三次判断。时间太少，组织者、专家团队没法消化，效果欠佳，解决不了问题，反倒影响这个重要方法的推广。

德尔菲专家判断法看上去简单，其实是个重武器，因为涉及跨职能部门。越是简单的方法，越需要精心的设计。它不是简单地把几个人叫到一起，开个会那样简单。初次应用的时候，至少给专家团队三次机会接触：第一次是初始培训，让大家有初步的了解；第二次是介绍要做的项目，顺便再温习一下方法论；第三次是分发项目背景数据，结合具体的项目再一次介绍整个方法论。

这位实践者一再问：能否更快点？他们在做年度计划，包括一些影响深远的决策。当然可以更快一点，不过风险是欲速则不达。很多企业为了赶时间，就经常性地陷入“从来没有时间一次把事情做好，但总有时间两次、三次把事情做好”的怪圈。

就拿这个企业来说，他们想借助德尔菲专家判断法，预测3个已有系列、1个全新系列产品的年度销量。4个产品系列，线上、线下业务并存，这意味着有8个数据点，要判断的内容太多，特别是在行业发生巨变的情况下，有很多变量要考虑，很难有人能够对付这么多的问题，做出高质量的判断。

为了降低实施难度，我帮助他们简化为三个独立的判断，亦即三个项目，因为专家团队不同：（1）3个老产品系列，线上销量预测；（2）3个老产品系列，线下销量预测；（3）1个新产品系列的整体销量预测。线上和线下之所以分开，是因为专家虽有交叉，但不同。对于全新产品，尚无线上、线下的销售历史，那就整合到一起来预测。从该项目立项，到制订初步方案，再到我帮助他们简化方案，已经快两个星期过去了，这还不包括背景数据的收集、整理，专家团队的组建、培训等准备工作。再加上一轮、两轮的判断，至少又得两个星期，如果要做到位的话。

实践者问

新冠肺炎疫情期间，如何预测？

刘宝红答

新冠肺炎疫情增加了不确定性，需求和供应的不确定性都是，比平日更需要群策群力，以避免大错特错。类似的情况还有更多，比如大宗原材料的价格走势，半导体芯片的短缺状况等，都是德尔菲专家判断法的适用对象。

“平时”与“战时”：两类典型的需求预测问题

需求相对稳定时，选用数据模型来精打细算

实践者问

刘宝红答

小贴士 计划软件往往优于人工，为什么不被采用

实践者问

刘宝红答

案例 预测模型一直都很准，直到……

不确定性高时，群策群力避免大错特错

实践者问

刘宝红答

实践者问

刘宝红答

实践者问

刘宝红答

小贴士计划软件往往优于人工，为什么不被采用

案例预测模型一直都很准，直到……