在本章中,我们高度抽象地讨论了机器学习:机器学习是什么,为什么机器学习很重要,以及机器学习可以解决什么样的问题。我们知道机器学习问题有3种形式:监督学习、无监督学习和强化学习。我们讨论了监督学习的重要性,监督学习领域可以进一步分为两个子领域:分类和回归。分类模型允许我们将对象分为已知的类(如将动物分类为猫和狗),而回归分析可以用于预测目标变量(如二手车销售价格)的连续结果。
我们还学习了如何使用Python Anaconda发行版构建一个数据科学环境,如何从GitHub获取本书的最新代码,以及如何在Jupyter Notebook中运行代码。
有了这些工具,现在我们就可以开始更详尽地讨论机器学习了。在第2章,我们将研究机器学习系统的内部工作原理,并学习如何在NumPy和Matplotlib等常见Python工具的帮助下,用OpenCV处理数据。