通过第2章的学习,我们初步了解了机器学习的一般流程、多种风险函数、常见的一元回归模型与cftool工具等。但是,仅仅会使用GUI
环境的cftool还是不够的。由于本书中介绍的大部分模型是基于Python实现的,所以读者有必要了解Python的基本语法知识,以便理解书中的代码。
本章首先介绍Python环境的搭建,鉴于MATLAB的功能正在日益完善,亦会简单介绍一下MALTAB机器学习的常用工具箱。然后重点介绍多元线性回归模型的原理及其Python实现和正则化。同时介绍一个简单而有用的分类器——逻辑回归,最后介绍分类问题中会遇到的困难和解决办法。
通过本章的学习,读者可以掌握以下内容:
如何在计算机上搭建Python环境;
MATLAB的一些常用工具箱的使用;
多元线性回归模型及其Python实现;
正则化的定义和正则化缓解过拟合的原理;
逻辑回归模型及其Python实现;
类别不均衡问题的定义及其解决方法;
多分类问题化成二分类问题的方法。
注意: 如果读者难以理解本章的代码,请先仔细阅读附录。