2012年《统计学习方法(第1版)》出版,内容涵盖监督学习的主要方法,2019年第2版出版,增加了无监督学习的主要方法,都属于传统机器学习。在这段时间里,机器学习领域发生了巨大变化,深度学习在人工智能各个方向取得了巨大突破,成为机器学习的主流技术,彻底改变了机器学习的面貌。有些读者希望能看到与之前风格相同的讲解深度学习的书籍,这也触发了作者在原来《统计学习方法》的基础上增加深度学习内容的想法(计划今后再增加强化学习)。从2018年开始,历时3年左右,完成了深度学习的写作。
考虑到内容的变化,现将书名更改为《机器学习方法》。第1篇监督学习和第2篇无监督学习基本为原来的内容,增加第3篇深度学习,希望对读者有所裨益。传统机器学习是深度学习的基础,所以将这些内容放在一本书里讲述也有其合理之处。虽然深度学习目前是大家关注的重点,但传统机器学习仍然有其不容忽视的地位。事实上,传统机器学习和深度学习各自有更适合的应用场景,比如,深度学习长于大数据、复杂问题的预测,特别是人工智能的应用;传统机器学习善于小数据、相对简单问题的预测。
本书的定位是讲解机器学习的基本内容,并不完全是入门书。介绍的内容都是最基本的,在这种意义上适合初学者。但主旨是把最重要的原理和方法做系统的总结,方便大家经常阅读和复习。在写第3篇的时候也接受大家对第1篇和第2篇的反馈意见,在力求文字简练的同时,也确保叙述的详尽,以方便读者理解。在各章方法的导入部分适当增加了背景和动机的介绍。
第3篇中使用的数学符号与第1篇和第2篇有一定的对应关系,但由于深度学习的特点也有一些改变,也都能自成体系。将符号完全统一于一个框架内还需要做大量的工作,希望在增加第4篇强化学习之后再做处理。
对第3篇的原稿,郑诗源、张新松等帮助做了校阅,对一些章节的内容提出了宝贵的意见。责任编辑王倩、孙亚楠也为本书的出版做了大量工作。在此对他们表示衷心的感谢。
李航
2021年5月27日