深度学习实战：基于TensorFlow 2和Keras最新章节_安东尼奥·古利著

1.15　迈向深度学习方式

实现手写数字识别时，我们得出的结论是，准确度越接近99%，改进难度就越大。如果需要更多的改进，肯定需要一个新的想法。

直观感受是，在目前为止的示例中，我们未利用到图像的局部空间结构。特别地，以下这段代码将表示每个手写数字的位图转换为一个平面向量，其中的局部空间结构（某些像素彼此更靠近）消失了：

然而，这不是大脑的工作方式。记住，我们的视觉系统基于多个皮层级别，每个级别会识别越来越多的结构化信息，同时还保留了局部性信息。首先看到单个像素，然后从中看到简单的几何形状，进而识别出越来越复杂的元素，比如物体、面部、人体、动物等。

在第4章中，我们将看到一种特殊类型的深度学习网络，称为卷积神经网络（Convolutional Neural Network，CNN），它既考虑保留图像中局部空间结构信息（不失一般性，具有空间结构的任何类型信息），又考虑通过渐进级别的抽象进行学习：经一层仅能学习一些简单模式；经多层能学习多种模式。在开始讨论CNN之前，我们需要详细讨论一些TensorFlow架构，并介绍一些机器学习的其他概念。这将是后续几章的主题。

1.15 迈向深度学习方式

1.15　迈向深度学习方式