概率统计和优化是理解机器学习不可或缺的基本知识,本章是对概率统计和优化基础的基本介绍,目的是使本书尽可能自成体系,故本章的介绍也是“拼盘”性质的,对于读者来讲,只需要选读不熟悉的内容,熟悉的内容可以跳过。本章分别介绍了概率基础(包括常见概率实例)、统计基础(包括最大似然原理和贝叶斯估计)、决策理论、建立在统计基础上的信息论概要、一个非常简短的非参概率模型及最基本的优化算法。
对于缺乏概率统计基础和优化基础的读者,通过阅读本章能够继续学习本书的后续章节,但对于想更深入研究机器学习的读者来讲,这些介绍是浅显的。需要进一步补充概率统计基础的读者,可参考Ross的书或陈希孺的教材,需要加深信息论知识的读者可参考Cover等的著作或朱雪龙的书,MacKay的著作则将信息论、统计推断和机器学习算法融在一起进行介绍,很有特点;对于优化技术尤其凸优化技术感兴趣的读者,可参阅Boyd或袁亚湘等的教材。