PREFACE
前言

为什么要写本书

2022年11月30日，ChatGPT模型问世并立刻在全球范围内引起了轩然大波。无论AI从业者还是非从业者，都在热议ChatGPT极具冲击力的交互体验和惊人的生成内容。这使得人们对人工智能的潜力和价值有了更深入的认识。对于AI从业者来说，ChatGPT模型成为一种思路的扩充，大型语言模型不再是刷榜的玩具，所有人都认识到高质量数据的重要性，并坚信“有多少人工，就会有多少智能”。ChatGPT模型效果过于优秀，在许多任务上，即使是零样本或少量样本数据也可以达到SOTA（Stafe Of The Art，最高水准）效果，因而很多人转向大型语言模型的研究。

不仅Google提出了对标ChatGPT的Bard模型，国内也涌现出了许多中文大型语言模型，如百度的“文心一言”、阿里巴巴的“通义千问”、昆仑万维的“天工3.5”、商汤的“日日新”、知乎的“知海图AI”、清华智谱的“ChatGLM”、复旦的“MOSS”等等。斯坦福大学的Alpaca模型问世之后，证明了70亿参数量的模型虽然达不到ChatGPT的效果，但已经极大地降低了大型语言模型的算力成本，使得普通用户和一般企业也可以使用大型语言模型。之前一直强调的数据获取问题，可以通过GPT-3.5或GPT-4接口来解决，并且数据质量相当高。如果只需要基本的效果模型，数据是否再次精标已经不是那么重要了（当然，要获得更好的效果，则需要更精准的数据）。

在此期间，涌现出了大量相关的博客、论文和开源项目。笔者的感觉是“每天都要学习太多东西，但所学的内容都太零散了”。经过一番思考和准备之后，笔者决定系统地梳理目前ChatGPT所涉及的相关技术，以帮助读者进行深入的学习。本书主要强调知识的系统性和完整性，这是网络学习所无法替代的。技术书可以弥补新媒体碎片化教育的短板，阅读图书更便于查漏补缺。正规的技术书在内容严谨性方面做得相对较好，对内容的正确性和规范性要求极高，更适合从业人员进行学习和日常检索。当然，学习的道路并不是非此即彼，只有利用各种方式，多渠道学习，才能真正实现全方位高效学习。

技术的变化是飞速的，在撰写本书初期，还没有出现LLaMa、GPT-4、ChatGLM等模型，当它们出现之后我们随之修改了相关内容，以期本书介绍ChatGPT相关技术时更具前沿性。技术会持续更新换代，书中提到的很多技术也许在不远的将来便会被更为强大的技术所取代，但这并不影响我们学习这些技术的原理，因为学习这些技术本身会引发更深层次的思考。

读者对象

本书适合以下读者阅读：

❑AIGC（AI Generated Content，人工智能生成内容）相关领域的研究人员或技术人员。

❑初入AI行业且基础不深的从业人员。

❑对ChatGPT感兴趣的非从业人员。

本书特色

本书是一本集理论、实战和落地于一体的ChatGPT力作，具备以下特点。

❑理论联系实际：本书不仅全面介绍了自然语言处理与强化学习的相关理论知识，还通过案例讲解使这些理论更易于理解和掌握，帮助读者在实践过程中更深入地了解这些领域的基础和前沿动态。

❑实战应用落地：本书详细介绍了如何从零开始，逐步构建一个独立且具有个性化特点的大型语言模型。通过分析代码和实际案例，帮助读者更好地理解和掌握相关技术，从而实现自己的创新应用。

❑扩展AIGC视野：本书针对AIGC领域进行全方位的剖析，而非仅关注ChatGPT本身。这使得读者能够全面了解AIGC的发展历程、技术原理、应用场景和未来趋势，为自己的研究和实践提供更广阔的视野。

❑洞悉行业发展：本书作者具有丰富的AI从业经验，对AI领域的发展动态、技术挑战和应用前景有深刻的认识。因此，本书不仅提供了严谨的技术分析，还融入了作者的专业洞察，帮助读者在理论与实践之间找到最佳的平衡点。

如何阅读本书

本书从逻辑上分三部分。

第一部分（第1和2章）从宏观角度带领读者了解ChatGPT。第1章介绍ChatGPT的由来、发展史以及用例。第2章对ChatGPT进行解构，基于AIGC相关背景知识逐步展开ChatGPT所应用的技术栈，让读者对ChatGPT有更加完整的认知。

第二部分（第3~9章）介绍ChatGPT的核心技术。本书强调理论与实战并行，在介绍相关技术的同时，针对相应核心算法展开实战，在真实中文数据集下验证算法性能，让读者从更深层次了解相关算法。第3章介绍基于Transformer结构的预训练语言模型。第4章介绍强化学习的基础知识。第5章介绍从提示学习与大型语言模型涌现出来的上下文学习、思维链等能力。第6章介绍大型语言模型的训练方法及常见的分布式训练框架。第7章重点对GPT系列模型进行分析。第8章介绍PPO强化学习算法以及基于人工反馈的强化学习整体框架的设计。第9章进行类ChatGPT的实战，通过文档生成问题任务模拟完整的ChatGPT训练过程。

第三部分（第10章）对ChatGPT的未来发展进行展望。从AIGC未来发展方向出发，探索云边协同、工具应用、可控生成、辅助决策四方面内容，分别从C端场景和B端场景探索ChatGPT与实际应用场景的结合点，并给出从事AIGC行业的参考建议。

勘误和支持

由于作者水平有限，书中难免存在一些遗漏或者不够准确的地方，恳请读者批评指正。如果你发现了书中的错误或遇到任何问题，可以将其提交到https://github.com/liucongg/ChatGPTBook，也可以发送邮件至邮箱logcongcong@gmail.com，我们将在线上提供解答。期待得到你的真挚反馈。

致谢

首先要感谢提出ChatGPT的每一位研究员，是他们的坚持让我们有机会体验到如此伟大的模型，也让我们对人工智能有了新的认识。

感谢我的硕士导师侯凤贞以及本科期间的关媛老师、廖俊老师、胡建华老师、赵鸿萍老师、杨帆老师等，是他们指引我走到今天。

感谢我的朋友杜振东、涂铭、沈盛宇与我一起编写本书，他们的专业知识让本书增色不少。

由衷感谢云问公司创始人王清琛、茆传羽、张洪磊对我工作的支持，并感谢在云问共同奋斗的每一位充满创意和活力的朋友：张蹲、李平、林思琦、杨萌、王杰、杨兆良、李辰刚、张荣松、徐健、张媛媛、张雅冰、孟凡华、李蔓，以及其他很多朋友。十分荣幸可以同各位在一家创业公司一起为人工智能落地而努力奋斗。

最后感谢我的爸爸妈妈、爷爷奶奶，感谢他们将我培养成人，并时时刻刻给予我信心和力量！谨以此书献给我亲爱的妻子崔天宇！

刘聪