《韩非子》中有这样一句话:“世之显学,儒墨也。”斗转星移,今天当我们环视四周,试图找出那个对于当下乃至未来发展拥有巨大影响的“显学”时,“人工智能”或许就是那个众口一词的答案。
近五年以来,机器学习方法在人工智能方面取得了瞩目的成就。我们可能并没有意识到,机器学习的应用早已渗入我们的工作与生活。当我们使用搜索引擎搜索的时候,机器学习被用于帮助搜索引擎判断哪个结果更匹配我们的想法。大部分垃圾邮件已不再构成困扰,这是因为机器学习已经为我们做了过滤。我们在网站上购物或者去视频网站消遣的时候,机器学习提供推荐商品并帮助生成字幕。可以说,在现代的信息社会中,在互联网泛化的时代,我们无时无刻不受益于机器学习带来的诸多好处。
传统上,我们解决问题主要依赖开发人员针对具体问题写出特定程序。不同于传统的解决方案,以机器学习为代表的智能化方案不是为计算机设计出一个解决问题的特定方法,而是让计算机在一个场景中基于模型算法自己找到最佳答案。由此可以看出,机器学习方法通常包含三个重要部分:场景、算法和数据。也就是说,当涉及人工智能领域的应用实践时,除了海量的数据、精妙的算法之外,还需要考虑特定领域的场景化实践。从以往的经验来看,一个成功的机器学习项目就是从找到正确的应用场景开始的。
在机器学习领域最典型的两大类问题就是聚类和分类。因此无论哪一个场景,只要能对应上聚类和分类的问题,大多是已经很成熟的应用场景了。但聚焦到公司的业务自动化场景中时,我们就遇到了巨大的挑战。现有的大量关于机器学习的知识与经验,大多以机器学习的研究为中心。如果以烹饪来类比,那么现有的这些知识传授的是如何使用烤箱之类的方法,而不是如何烹制可口食物的创新菜谱。在大多数公司的业务自动化场景中,我们需要的仅仅是烹饪某种具体食物的方法,即解决公司存在的真实问题。这一问题不能归咎于公司,因为当今的人工智能领域存在的问题之一就是,一味地关注学术研究而非工程实践。我们希望看到的适用于公司的机器学习是,它可以在公司中为任何人所用,并且可以解决一些问题,从而立竿见影地提高公司自动化效率,如应付账款(供应商发票)、设施管理(功耗预测)、客户支持(支持通知单)和销售(客户保留)等。
本书可以说是将机器学习带入公司自动化这个场景的最佳实践指南,理由如下:第一,作者道格·哈金与理查德·尼科尔自身就在这个领域拥有二十多年的实战经验;第二,书中列举的六大场景均是公司通用且具有实践意义的领域;第三,书中的实践基于AWS(Amazon Web Services)推出的机器学习平台SageMaker——以我的经验来看,这是一个面向机器学习应用开发的成熟、高效的平台工具,可以极大地降低开发的门槛并提高开发的效率。
公司对于创新和生产效率提高的需求永无止境,而成为“机器学习型公司”将是公司达成这个目标的有效手段。机器学习对公司的真正好处在于,它使公司能够构建可适应变化的决策应用程序。我们不再需要编写数十个或数百个僵化的业务规则,而是输入过去的好坏决策的示例,然后让算法根据当前场景与过去数据的相似度来做出决策。从这一点来看,对于公司来说,机器学习几乎拥有改进一切的潜力。
感谢两位作者分享了他们的经验,感谢我的朋友范东来为翻译本书所付出的辛苦和努力。在这些知识的积累之上,希望有更多的公司在场景化机器学习的实践中为我们续写新的篇章。
费良宏
AWS首席开发者布道师