购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3.2 使用大语言模型做数据分析

大语言模型的典型代表是OpenAI公司的ChatGPT,这是一种基于语言模型的对话生成模型。你可以将其看作一个可以自动生成内容的聊天机器人,能够对用户提出的问题进行回答,进行自然的对话交互。这种生成对话内容的过程,可以比喻成词语接龙,也就是ChatGPT根据你的输入,来预测下一个字符的输出。这本质上是自然语言处理(natural language processing,NLP)中语言模型(language model)的应用。语言模型是一种可以预测文本序列中下一个词的概率分布的模型。要想更深入理解ChatGPT这类大语言模型(large language model,LLM),我们可以学习深度学习、语言模型、注意力机制、Transformer、GPT相关内容。

GPT模型是一个大家族,从GPT开始,改进到目前OpenAI公司最新的模型GPT-4,为了方便表示,本书将GPT-3.5以后的大语言模型都称为ChatGPT,因为这样的一类语言模型都具有对话(chat)的高水平表现了。我国的大语言模型也在不断改进,比较典型的有清华大学唐杰团队开发的ChatGLM(智谱清言,https://chatglm.cn/)。后续,我们也使用“大语言模型”或者“LLM”来指代以ChatGPT为代表的对话生成模型。

LLM的工作原理可以这么理解:

· 输入处理:LLM接受用户输入的文本,并将其转化为模型可以理解的数字表示。

· 上下文理解:LLM使用已经学习到的模型参数和上下文信息来理解输入的文本。

· 预测并生成输出文本:LLM根据上下文信息和已经学习到的知识,预测输出的文本。LLM将预测的输出信息转换为自然语言文本,并将其呈现给用户。

值得注意的是,本书中所有的AI生成模型结果,仅作为扩展阅读供读者参考,以学习如何使用GPT做数据分析。对于GPT的输出内容,我们要仔细辨别评估,因为LLM会出现胡言乱语(幻觉)。

除了直接使用ChatGPT交互学习,更常见的做法是使用大语言模型的API构建数据分析应用。例如,利用OpenAI的API,我们能够快速构建具有创新和创造价值能力的功能,这在以前是成本高昂、高度技术化或根本不可能的。这一般需要设计提示语(prompt)让语言模型产生你期望的输出,这方面的技巧我们可以在课程“ChatGPT Prompt Engineering for Developers”中学习 LCWc8xeYvlUEHJ1GFAo14R62P/Afdu+UGJFzfOX4G4ZHPS//6Xj+pWn4+24dQ9pO

点击中间区域
呼出菜单
上一章
目录
下一章
×