本章从宏观视角探索了机器学习,并且在全局上介绍了机器学习及其主要概念,后续章节将会更加详细地探讨这些概念。监督学习有两个重要的子领域,即分类和回归。分类模型将样本归类为已知的类别,回归分析可以用来预测数值为连续型的目标变量。无监督学习不仅可以从未标记数据中发现规律,而且还可以用于特征预处理中的数据压缩。
本章还简要地介绍了机器学习应用的典型流程,这个流程为后面章节深入讨论和动手实践奠定了基础。最后,搭建了Python环境,安装并更新了所需的软件包,为运行机器学习的示例代码做好了准备。
除了机器学习算法本身,接下来介绍了数据预处理方法,这些方法将帮助机器学习算法达到最佳的性能。除了概括性地介绍分类算法外,还探索了回归分析和聚类等方法。
我们将迎来一段激动人心的旅程——探讨机器学习这一广阔领域中的许多强大的算法。通过本书各个章节的学习,我们将逐步建立起自己的知识体系,深入地掌握机器学习领域的知识和算法。下一章将通过实现早期的机器学习分类算法开始这段旅程,这也将为第3章做准备,第3章将讨论Scikit-Learn开源机器学习库的高级机器学习算法。