购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.15 迈向深度学习方式

实现手写数字识别时,我们得出的结论是,准确度越接近99%,改进难度就越大。如果需要更多的改进,肯定需要一个新的想法。

直观感受是,在目前为止的示例中,我们未利用到图像的局部空间结构。特别地,以下这段代码将表示每个手写数字的位图转换为一个平面向量,其中的局部空间结构(某些像素彼此更靠近)消失了:

然而,这不是大脑的工作方式。记住,我们的视觉系统基于多个皮层级别,每个级别会识别越来越多的结构化信息,同时还保留了局部性信息。首先看到单个像素,然后从中看到简单的几何形状,进而识别出越来越复杂的元素,比如物体、面部、人体、动物等。

在第4章中,我们将看到一种特殊类型的深度学习网络,称为 卷积神经网络(Convolutional Neural Network,CNN) ,它既考虑保留图像中局部空间结构信息(不失一般性,具有空间结构的任何类型信息),又考虑通过渐进级别的抽象进行学习:经一层仅能学习一些简单模式;经多层能学习多种模式。在开始讨论CNN之前,我们需要详细讨论一些TensorFlow架构,并介绍一些机器学习的其他概念。这将是后续几章的主题。 VDXpAqlheEtyoQoTJc7iIaH4plJTF+NQrTMDhIWrhNR6/Hs9t3oxKpkNLeRKNxI+

点击中间区域
呼出菜单
上一章
目录
下一章
×