购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 大语言模型的发展

1775年,詹姆斯·瓦特改良了蒸汽机,成功解决了工业化进程中的核心问题,开启了工业革命的新篇章。1879年,爱迪生发明了电灯泡,为黑夜带来了光明。1882年,世界上首座商用发电厂建成,奠定了现代电力系统的基础。1887年,尼古拉·特斯拉研发了交流电系统。这些伟大的发明不仅改变了人类的生活方式,还推动了社会的进步。

进入20世纪,科技发展迈入了全新的阶段。1946年,ENIAC的问世标志着电子计算机时代的开启,人类由此进入了计算机时代。1975年,Altair 8800的出现首次将计算机技术引入个人领域,揭开了个人计算机时代的序幕。随后一系列技术的进步极大地加速了信息时代的到来。1989年,万维网的诞生使信息交流变得空前便捷;1998年,谷歌的成立进一步推动了互联网时代的迅猛发展。

进入21世纪后,2007年苹果公司发布了首款iPhone,移动互联网时代随之迅速到来,人类的生活方式和信息获取途径再次发生了翻天覆地的变化。直至2020年,OpenAI发布了GPT-3,这一事件标志着人工智能时代的全面来临。新技术的代际更替从以往的百年间隔迅速缩短至十年,清晰地反映了科技发展的加速趋势。

人工智能时代的到来是人类社会发展的重要转折点。在这一新时代,无论是个体还是组织,若不能积极拥抱人工智能,便有可能被时代淘汰。人工智能模型是新时代的核心要素,技术从业者需深入了解其背景知识,方能更好地适应并推动新时代的发展。

在大语言模型出现之前,自然语言处理(Natural Language Processing,NLP)模型经历了多个阶段的发展。下面是较为关键的几个阶段。

1.理论模型阶段

理论模型以香农的信息论为代表,研究自然语言的信息量和信息熵。1948年,香农将马尔可夫过程模型应用于自然语言模型,并提出将热力学中熵的概念扩展到自然语言建模领域。

2.基于统计学的自然语言处理阶段

该阶段的代表性模型是N-gram模型和隐马尔可夫模型(Hidden Markov Model,HMM)。N-gram模型是统计语言模型中较为简单的一种模型,它假设一个词的出现概率仅与其前面的 N -1个词相关。HMM是一种处理序列数据的统计模型,适用于语音识别、机器翻译等任务。

3.神经网络模型阶段

该阶段的代表性模型为循环神经网络(Recurrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network,CNN)。RNN能处理序列数据,适用于机器翻译、语音识别等任务。CNN能处理图像数据,适用于文本分类、情感分析等任务。

4.大语言模型阶段

该阶段的代表性模型包括BERT和GPT-3等。BERT是Google AI于2018年发布的预训练语言模型,凭借卓越的语言理解能力,它受到广泛关注。BERT的问世标志着自然语言处理领域从传统的人工特征工程迈向深度学习时代。

按照关键算法模型的实现顺序,自然语言模型的发展脉络如图1-1所示。图1-1中的算力数据来源于维基百科。

如图1-1所示,自然语言处理以理论为基础。在有限算力的支持下,人们通过统计方法对自然语言进行建模。随着计算机算力的提升,神经网络模型逐渐应用于自然语言处理领域。随着更大规模算力的实现,大语言模型应运而生,其出现标志着自然语言处理进入了AI时代。

虽然我们已经进入了大语言模型时代,但传统的自然语言处理模型仍具备独特的优势,如低算力消耗、响应速度快等。在实际应用中,应根据具体任务需求选择合适的模型。

下面将详细介绍常见的大语言模型,以便读者对大语言模型有一个全面认识。

图1-1 自然语言模型的发展脉络 lcyKAQrBHMsR6FNVdOxZGHzNQWrKAfms8O3U/0r/DKJ4n8FLJTHQ52qa/x8qigrU

点击中间区域
呼出菜单
上一章
目录
下一章
×