机器学习是人工智能领域中最能够体现机器智能的一个分支,也是人工智能领域发展最快的一个分支,其主要研究计算机如何模拟人类的学习行为,以获取新的知识和技能,并在对新知识不断学习的过程中逐步提升计算机的学习能力。数据、学习算法和模型是机器学习的三要素,计算机通过输入的数据,利用相关的学习算法,得到稳定的模型结构,产生可靠的预测结果。机器学习过程分为4个主要步骤:数据预处理、机器学习或模型训练、模型评估以及新数据预测。根据训练数据是否有标注,机器学习可以分为监督学习和无监督学习两大类。除此之外,机器学习还包括集成学习、深度学习和增强学习等内容。
本书通过具体的编程实践案例,全面系统地讲述了机器学习涉及的核心内容。全书共分为13章,包括机器学习概述、基于OpenCV的数据处理、监督学习、无监督学习、数据表示和特征工程、基于决策树的医疗诊断、基于支持向量机的行人检测、基于贝叶斯学习的垃圾邮件过滤、基于深度学习的手写数字分类、集成分类方法、模型选择与超参数调优、OpenCV 4.0中的OpenVINO工具包等内容。
为了便于学习,作者在GitHub上提供了相关用例的完整源代码,供读者下载使用。通过书中提供的用例代码,读者可以快速熟悉并掌握机器学习领域的相关知识。本书既适合想要从事机器学习及其相关领域研发的初学者,又适合致力于机器学习研究的高层次读者。对于初次接触机器学习及其相关领域的人员,在阅读本书前,建议预先阅读Python编程的相关书籍,或者学习有关Python编程的在线教程。
本书由重庆邮电大学教师刘冰博士历时4个多月翻译完成。为了能够准确地完成本书的翻译,译者查阅了大量有关机器学习、深度学习以及OpenCV 4.0等方面的中外文图书资料。但因水平有限,译文中难免存在疏漏,恳请读者批评指正。
感谢机械工业出版社华章公司的编辑,是他们的严格要求,使本书得以高质量出版。
刘冰
liubing@cqupt.edu.cn