大语言模型在完成各类NLP(自然语言处理)下游任务方面有了显著进步,各种垂直领域的大模型如雨后春笋般不断涌现。然而,在软件交付领域,各企业的实践较为滞后,缺乏有说服力的相关案例。在软件交付领域,DevOps的热度最高且实践较为成熟,围绕DevOps能力衍生出了DevSecOps、DataOps、NoOps、MLOps等一系列细分领域。在后DevOps时代,传统能力的右移激活了SRE(网站可靠性工程),进一步凸显了可靠性与稳定性保障,尤其在技术层面与业务连续性紧密关联。同时,平台工程提供了更全面的全局性思路,在SRE和DevOps体系的基础上进行了扩展,提供了支撑全面且具备业务视角的产品开发交付平台。
未来,随着企业规模的不断扩大和商业模式的持续转变,软件交付能力需要实现质的提升。DevOps体系提供了流水线交付构件的能力,SRE提供了高可靠的应用程序交付基础架构,平台工程致力于解决组织架构内不同部门的工具协同问题。相关研究数据显示,大多数企业在软件交付过程中,尽管进行了多种尝试和实践,但仍然遇到了一个共同的问题——认知负荷。复杂的工具和细化的流程显著增加了IT人员的认知负荷,众多工具和框架需要IT人员学习和应用,而这些繁杂且不断涌现的技术反而阻碍了IT人员最为关键的本职工作——软件交付。
与此同时,随着越来越多的大语言模型的涌现,也需要一个具备集成能力的平台,推动人工智能的真正落地,帮助IT人员构建更强大、更丰富的软件交付数据集,扩展软件交付领域专有语料库的词表,最终通过模型能力助力DevOps、SRE和平台工程的落地及智能化实践,以提升软件交付领域的开发、测试、运维、监控、安全等场景的效率并节约成本。
基于以上背景,我们编写了这本关于大模型在软件交付过程中的实践的参考书,旨在帮助读者全面理解大模型的基础理论,深入掌握大语言模型的知识框架,了解大模型在软件交付过程中的应用价值。
❑ 对DevOps体系、SRE和平台工程感兴趣的人员。
❑ 软件交付链路上的节点人员,如项目经理、需求分析师、研发工程师、测试工程师、运维工程师、安全管理人员。
❑ 对大语言模型感兴趣的人员。
本书共11章,从逻辑上分为三篇。
基础篇(第1~3章)简要介绍大语言模型的发展与起源、Transformer模型及ChatGPT相关内容,涵盖GPT模型的结构与完整实现,以及Transformer模型的基本原理。
进阶篇(第4~6章)重点讲解大语言模型的微调技术、RAG的基本原理,以及软件交付的三大底座——DevOps、平台工程和SRE。
实践篇(第7~11章)重点讲解大语言模型在运维、测试、编程、项目管理、安全中的应用。
由于我们的水平有限,书中难免存在不足或错误,敬请读者批评指正。如有宝贵意见,欢迎发送至邮箱363328714@qq.com,期待读者的真挚反馈。
本书的编写得到中国信息通信研究院的大力支持。
感谢云智慧的张博、北京大学的李戈教授和李力行博士、清华大学的裴丹教授、南京大学的裴雷教授、复旦大学的彭鑫教授、上海交通大学的束骏亮博士、蜚语科技的陈悦、LigaAI的周然及南京邮电大学的季一木教授,他们提供了大量素材和建议。
感谢阿里巴巴的刘凯宁、B站的刘昊、腾讯的杨军和陈自欣、美图的石鹏、趣丸的刘亚丹、DevOps联盟的刘征、快猫星云的来炜、广发证券的彭华盛、联通软研院的李明亮、浙江移动的叶晓龙在本书写作过程中给予的支持和帮助。
此外,感谢SRE精英联盟,尤其是赵成和党受辉,给予了我们很多思路和启发。
最后,感谢我的家人给予的鼓励,他们永远是我最坚强的后盾。
顾黄亮