购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 ChatGPT简介

本节首先讲述ChatGPT的概念和发展历程,再讨论ChatGPT的特点,为后续介绍ChatGPT原理和应用做铺垫。

1.1.1 ChatGPT前世今生

时至今日,ChatGPT的爆火和“出圈”已经无须赘述,可以说大街小巷、老少妇孺间都有关于它的传说。那么,ChatGPT到底是什么?我们不妨带着“我是谁?我从哪来?要到哪去?”的终极问题向ChatGPT提问,先听听它的自我介绍:

Question:

你好,ChatGPT,请问你是谁?你从哪来?要到哪去?

ChatGPT的回答如下:

Answer:

你好!我是ChatGPT,一个由OpenAI开发的人工智能语言模型。我是基于GPT(Generative Pretrained Transformer)系列模型的一个实例,这是一种深度学习模型,专门用于理解和生成人类语言。

我从大量的文本数据中学习而来。OpenAI的研究人员使用了各种来源的文本数据来训练我,包括书籍、网站和其他类型的文本。通过这种方式,我学习了语言的语法、词汇和一些基本的世界知识。

我的主要目标是帮助人们解决问题和完成任务。我可以帮助回答问题、写作、编程、学习新的概念,甚至可以进行一些基本的情感支持。我还在不断学习和进化,希望能够更好地理解和满足用户的需求。

至于我要到哪去,这取决于OpenAI的研究人员和用户的需求。我可能会继续学习新的知识和技能,也可能会被用于新的应用场景。但无论如何,我都会致力于提供有用、准确和友好的帮助。

借由它的自我介绍,我们可以总结:ChatGPT是由OpenAI开发的基于GPT(生成式预训练转换器)模型的一个变体,它可以用语言交流形式实现与人的交互,是一款强大的AI聊天机器人。

目前,ChatGPT已经发展到ChatGPT 4.0了,而ChatGPT 4.0和它的爆火当然不是像空中楼阁那样凭空出现的,而是建立在OpenAI对于语言模型,尤其NLP模型领域的持续研究与创造性探索之上的。我们可以大致将ChatGPT的发展历程分为四个阶段。

1.初试宝刀

2018年,OpenAI推出第一代生成式预训练模型GPT-1。这个模型采用了生成式预训练Transformer模型,这是一种采用自注意力机制的深度学习模型。GPT-1采用了半监督学习模式,通过无监督学习的预训练,运用大量未标注数据增强模型的语言能力,再进行有监督的微调,与大规模数据集集成以提高模型在NLP任务中的表现。

2.渐露锋芒

2019年,OpenAI推出了GPT-2,这是一个更大的模型,拥有超过15亿个参数,并且可以生成达到人类编写水平的文本。GPT-2的出现与性能提升,进一步验证了无监督学习的力量,即通过海量数据与大规模参数训练而成的NLP模型能够无须额外训练具备迁移到其他类别任务的能力。

3.爆火“出圈”

2020年,OpenAI推出了GPT-3,参数量达到了1750亿,GPT-3删去微调步骤,直接输入自然文本作为指令,提升了GPT在阅读文本后可接续问题的能力以及任务主题的广泛性。而2022年11月推出的GPT-3.5版本接近人类语言反应能力,GPT-3.5的主要杰作就是近期大火的ChatGPT。它使用了微软Azure AI超级计算基础设施上的文本和代码数据进行训练,在训练参数上增加到GPT-3的10倍以上,延续了OpenAI对大规模数据的追求。此外,它颠覆性地使用大量人工标注数据与有人类反馈的强化学习,使得ChatGPT表现出出色的上下文对话能力甚至编程能力。

4.步入多模态

2023年3月15日,OpenAI推出了ChatGPT 4.0,这是一个使用前所未有的计算和数据规模进行训练的模型,参数量呈指数级增长,是目前为止功能最强大的模型。ChatGPT 4.0在GPT-3.5的基础上支持了图像的输入,将语言到多模态的连通从可能变成了现实。引入多模态数据不仅支持了各种“图像-语言”任务的完成,同时也利用图像数据提升了语言处理能力,使模型的性能提升不再仅依赖于大量的语言数据。

纵观ChatGPT系列的发展,我们可以看到OpenAI始终贯彻大规模数据与生成式预训练Transformer模型的技术路线,并且在追求更大规模的模型和更强大的能力的同时,也在不断探索新的训练方法和模型架构。由此,模型的规模和能力都在持续增长,对人类语言的理解和生成能力也在不断提升。

1.1.2 ChatGPT的特点

现在我们已经知道ChatGPT的发展脉络了,那么ChatGPT到底具备了哪些特点,才让大家如此热烈地追捧呢?

这里我们可以总结出ChatGPT的七大特点。

(1)对话交互。这是ChatGPT最显而易见的特点,它以对话方式进行交互,你问我答、有问必答。

(2)连续多轮互动。ChatGPT可以根据上下文了解用户意图,并且能够记忆先前用户的对话信息,以回答某些假设性的问题,从而极大地提升了对话交互模式下的用户体验,完成多轮对话,真正像人类一样进行聊天交流。比如你可以先说“我喜欢吃巧克力”,然后再问“你能推荐一款吗?”ChatGPT会记住你之前的对话,并给出推荐的巧克力,如下所示。

Question:

我喜欢吃巧克力。

Answer:

那真是太好了!巧克力是一种非常美味的甜点,它不仅口感丰富,而且还含有能够提振人的心情的化合物。你有特别喜欢的巧克力品牌或者类型吗?比如黑巧克力、牛奶巧克力或者是带有坚果的巧克力?

Question:

你可以推荐一款给我吗?

Answer:

当然可以。如果你喜欢口感丰富且品质上乘的巧克力,我会推荐你试试Lindt的瑞士巧克力。Lindt是一家瑞士的巧克力品牌,它的巧克力口感细腻、味道丰富,非常受欢迎。特别是它的Lindt Excellence系列,有多种可口的口味,比如70%的黑巧克力、橙味黑巧克力,以及带有海盐、辣椒或者杏仁的巧克力,都是非常值得一试的。

当然,巧克力的口味因人而异,我建议您尝试多种口味,找到最适合你的那一款。

(3)多场景应用。ChatGPT能够完成多种日常任务,是一个功能强大的贴心助手,无论你是需要写一封邮件、创作一个视频脚本还是设计一段广告文案,甚至进行语言翻译或编写代码,ChatGPT都能帮你完成。

(4)问答系统。ChatGPT是聊天机器人和问答系统的结合,还可以帮助我们完成一些问答的功能。你可以向它提各种问题,比如“第一次鸦片战争发生在哪一年”或者“ E = mc 2 是什么意思?”它都能给出相应的答案。

(5)承认无知和错误。ChatGPT能够主动承认自身的无知和错误,并在用户指出错误后进行优化或者给出解决途径。比如:

User:

ChatGPT4用到了多少参数?

Answer:

截止到我最后一次更新(2021年9月),OpenAI发布的最新版本是GPT-3,它使用了1750亿个参数。GPT-4尚未发布,因此我无法提供关于GPT-4的参数数量的信息。如果有新的版本发布,我建议您查阅OpenAI的官方文档或者相关的科学论文来获取最新和最准确的信息。

(6)主动质疑不正确的问题。当遇到不正确的问题时,ChatGPT能够指出问题的错误并调整输出结果,比如:

Question:

汉高祖刘邦出生于公元1996年。

Answer:

对不起,这个信息不准确。汉高祖刘邦实际上出生于公元前256年,他是中国历史上的一位重要人物,是西汉的创始人。他在公元前202年建立了汉朝,这一朝代持续了四个世纪,对中国的历史产生了深远影响。公元1996年是近代,距离刘邦的生活时期已经过去了两千多年。

(7)支持多模态。ChatGPT 4.0可以支持“图像-语言”任务的完成,比如我们可以问ChatGPT“请用图表展示和简单说明ChatGPT的版本迭代”,于是ChatGPT可以输出如图1.1所示的示例。

图1.1 ChatGPT“图像-语言”任务示例

当然,世界上不存在绝对完美的事物,ChatGPT也是如此,这里我们也需要点出一些它的缺陷,主要体现在如下几个方面。

(1)数据泄露。ChatGPT是在大量的互联网文本上训练的,尽管它不会记住特定的数据源或文档,但它可能会生成在训练数据中看到过的信息,从而使它生成一些不准确或误导性的信息。

(2)生成能力的限制。虽然ChatGPT可以生成流畅且看似有意义的文本,但它并不真正理解它正在说什么,从而导致它可能会“一本正经地胡说八道”。

(3)可能会生成不适当的内容。尽管OpenAI已经采取了一些措施来防止ChatGPT生成不适当或冒犯性的内容,但它仍然有概率生成一些不适当的回答。 DFy6V98ilWcDd9tyzfXCeePTzvLJBGIe8kxVVI8FifjZha9L8gWOG5803cRhlw8k

点击中间区域
呼出菜单
上一章
目录
下一章
×