过去十年,我们见证了深度学习的蓬勃发展,见证了深度学习在自然语言处理、计算机视觉、多模态内容生成、自动驾驶等方向取得的巨大成功,见证了深度学习如何逐渐成为人工智能最热门的领域之一。当前,越来越多的学习者投身于深度学习技术领域,力图提升自己的专业技能,增强自己在就业市场上的竞争力,变成市场上最为抢手的人才。
但是,如何在短时间内快速入门并掌握深度学习,是很多读者的困惑——晦涩难懂的数学知识、复杂的算法、烦琐的编程……深度学习虽然让无数读者心怀向往,却也让不少人望而生畏,深感沮丧:时间没少花,却收效甚微。
目前,大多数深度学习的图书某种程度上是在“端着”讲,习惯于从专家视角出发,而没有充分考虑初学者的认知程度,这导致读者阅之如看天书,食之如嚼蜡。再者,即使是专业人士,面对领域内的最新进展,也往往苦于找不到难度适宜又系统全面的教材,只能求助于英文学术论文、技术文章和视频网站,由此浪费了大量时间和精力。我们始终觉得,真正的学习不应该让学习者倍感煎熬,而应该是一件让人愉悦且能带来成就感的事情。深度学习之所以能把人劝退,往往是教者不擅教、学者又不会学导致的。
说了这么多,你肯定好奇,本书有什么与众不同呢?在过去的几年里,我们一直在思考如何才能更好地教授深度学习这门课程。为此,我们在AI教育领域进行了积极的探索和创新,积累了一些经验,并赢得了业界和用户的高度认可。这套书 就是我们在深度学习领域的探索和实践成果,它最主要的特色有两个:“只说人话”和“突出实战”。具体而言,本书在如下方面有所侧重并作了差异化处理。
● 内容重构、全面细致
我们根据ACM和IEEE最新版人工智能体系的111个知识点,参考各类优秀资料,对深度学习理论进行了全面梳理,力求用一套书囊括从20世纪90年代到目前为止的几乎所有主流模型,让读者一套书在手,就能够建立有关深度学习的全局知识框架,而不用再“东奔西走”。对于算法的讲解,我们不会只局限于算法自身,而会从全局视角分析其中的内在联系和区别。我们会将知识点掰开揉碎讲清楚,充分剖析重点和难点,尽可能地为读者降低学习难度。
● 算法与代码紧密结合
这套书在引入任何新概念时,都辅之以简单易懂、贴近生活的示例,以期帮助读者降低理解难度,进而知道为什么要学习这个算法,数学公式怎么好记,以及在实际问题中怎么应用。此外,针对多数初学者“一听就会,一写就废”的情况,我们竭力提供详尽的“保姆式”教程,由简及繁,让读者敢动手,会动手,易上手。这套书配有交互式、可视化源代码示例及详尽的说明文档(以Jupyter Notebook的形式提供),提供了所有模型的完整实现,可供读者在真实数据上运行,还能亲自动手修改,方便获得直观体验。
● 形式生动,只为让你懂
看过梗直哥视频的读者都知道,形式生动是我们的特点。很多时候,一图胜千言,而动画比静图更容易让人理解。为此,我们将秉持这一优势和特点,力求让读者彻底学懂!越是复杂的概念,我们越是要把它讲解得深入浅出。
除此之外,为保证学习效果,我们还提供了在线课程和直播课程,把内容知识点切分成10~20分钟一节,共有百节之多;通过在线答疑、直播串讲等交流形式,增强互动感,加快读者的学习速度,提升学习效果。同时,还有学员讨论群,由专业老师随时解决读者的个性化问题,充分做到因材施教。
我们通过这套书对深度学习庞杂的知识点进行了细致梳理,以期带着读者从不同维度鸟瞰深度学习的世界。在这套书中,我们专门针对深度学习领域抽象难懂的知识点,利用作者丰富的行业积淀和独特的领域视角,结合日常生活中的实例,将这些高深的内容用简明、有趣的方式呈现,打破认知障碍,帮助读者轻松消化。同时,突出应用为先、实战为重的特点,为每个模型提供详尽完整的“手搓”代码和调库代码,由易到难层层递进。此外,这套书突破了传统图书单一的文字教学模式,采用图文、动画和视频相结合的方式,使深度学习的原理和应用场景更加直观和生动。
相信这套书能够打破读者对深度学习“学不会,入门难,不见效”的看法,帮助他们破解学习难题,快速掌握相关知识。
这套书针对不同的读者群体(初学者、有一定经验的读者和经验丰富的读者),提供了对应的教学内容和方法,旨在帮助各种背景和认知水平的读者更有效地学习、掌握深度学习技术,并应对实际挑战。
● 初学者群体
针对尚未涉足深度学习领域或经验较少的读者,如学生、转行者或独立学习者,这套书从深度学习的基本概念出发,采用通俗易懂的文字和实例,帮助读者迅速入门。同时,这套书梳理了必要的数学、计算机以及统计学基础知识,并推荐相应的参考资料与工具,以便读者自我学习和巩固知识。书中内容设计由浅入深,确保读者能够按部就班地领略深度学习的精髓。
● 中级群体
针对已具备深度学习基础,并且有一定实践经验的读者,比如从业者或者正在攻读相关硕士或博士学位的学生读者,这套书提供了更加深入的理论和技术讲解,整合了最新的研究进展和实践案例,确保你始终走在领域前沿并能更好地应对实际挑战。这套书重点讲解深度神经网络的核心理念、优化算法和模型设计技巧,同时详细讲解了当下热门的深度学习框架与工具,以期帮助读者更好地设计、实现和部署深度学习模型。
● 高级群体
对已有深度学习相关领域研究或工作经验,并对前沿研究和技术保持高度关注的读者,比如研究生、博士后或者专业人士,这套书提供了深入的理论和技术分析,帮助读者深入挖掘深度学习的内核及其固有规律。同时,为了方便读者深入研究和探索,我们还提供了相关论文引用和代码示例。
● “只说人话”,破解难题
深度学习常常因概念深奥、公式难懂、算法晦涩而著称,与其他图书只侧重知识传授而忽视读者的认知程度不同,这套书致力于将这些高深内容转换为通俗易懂的“人话”。在我们深厚的行业经验和独特的领域洞察基础上,这套书结合日常生活案例,采用一个个清晰而有趣的视角,帮读者突破理解的壁垒,真正实现知识的尽情消化和良好吸收。
● 贴合应用,突出实战
相比其他深度学习教材,这套书将算法与代码紧密结合,力求手把手教读者用深度学习的方法解决实际问题。这套书大部分章节提供了Jupyter Notebook的源代码,以及所有模型的完整实现,可供读者在真实数据上运行,更可亲自动手修改,方便获得直观上的体验,进而真正帮助读者掌握深度学习的核心算法,提升实际问题的解决能力。
● 图文视频,三位一体
有别于其他图书单一的说教式文字描述,这套书不只局限于传统纸质图书的形式,特别注重配图、动画和视频,以更直观的方式展现模型的原理和应用场景。这种立体多维度的教学方式能够让读者更加深入、轻松地理解深度学习。
● 多元互动,个性辅导
这套书有配套的GitHub专栏课程和视频课程(收费),可满足不同读者的需求和学习习惯。同时,有专业的答疑团队与读者进行互动交流,解答读者疑问和提供技术支持,能够针对读者个性化的问题和困难,提供更加有针对性的辅导,加快读者学习进程,真正实现因材施教。
本书侧重于深度学习基础知识和原理的讲解,力求用深入浅出的语言、图例、动画等多种生动的形式让初学者更加容易入门。本书总计9章,内容分别如下。
● 第1章 欢迎来到深度学习的世界 ——本章主要介绍深度学习的基本概念和应用领域,包括神经网络原理和发展历程,深度学习在计算机视觉、自然语言处理、语音识别等领域的应用。通过本章的学习,读者可以初步理解深度学习的核心理念和实践领域,为之后的学习奠定坚实的基础。
● 第2章 必要的数学预备知识 ——本章以新颖的视角,高效地带读者回顾深度学习所需的数学知识,包括线性代数、微积分、概率论等。本章内容可以帮助读者在温习中更加了解它们在深度学习中的应用,为后续章节的学习做好准备。
● 第3章 环境安装和工具使用 ——本章主要介绍与深度学习环境相关的Python安装、深度学习框架PyTorch的安装和使用,以及Jupyter Notebook等实用工具的操作方法。通过本章,读者可以掌握深度学习环境的搭建和必备工具的使用,为后续的学习实践打下良好基础。
● 第4章 深度神经网络:误差倒查分解 ——本章主要介绍深度神经网络的核心原理和常见的网络结构,包括多层感知机、前向和反向传播、回归和分类问题等。本章可让读者对神经网络的本质,也就是误差倒查分解有深入的理解,确保为接下来的学习铺好路。
● 第5章 常见挑战及对策:一切为了泛化能力 ——本章主要介绍神经网络训练过程中的常见问题,比如过拟合和欠拟合,以及相应的正则化解决方案。通过本章的学习,读者会对什么是泛化能力有更加清楚的认识和思考。
● 第6章 梯度下降算法及变体:高效求解模型参数 ——本章讲解最优化理论与深度学习的关系,在此基础上全面回顾各种优化算法的发展历程,并用统一的框架让读者高屋建瓴地理解它们内在的关系,从而对如何高效求解模型参数加深认知。
● 第7章 基础卷积神经网络:图像处理利器 ——本章将专注于基础卷积神经网络的介绍,从图像卷积、卷积层、池化层到具体的代码实现,帮助读者快速熟悉这个图像处理利器。
● 第8章 基础循环神经网络:为序列数据而生 ——本章以序列数据为主要讨论对象,详细介绍基础循环神经网络模型的方方面面。
● 第9章 注意力神经网络:赋予模型认知能力 ——本章将会详细介绍注意力机制的原理和常见的注意力机制模型Transformer。通过本章学习,读者可以了解注意力机制的发展历程、核心思想和应用场景,深刻认知除CNN、RNN之外这第三类神经网络的奥秘。