AI智能办公：从训练ChatGPT开始最新章节_凌祯著_掌阅小说网

下载掌阅APP，畅读海量书库

立即打开

畅读海量书库

扫码下载掌阅APP

第2章
为什么将编程作为ChatGPT的训练载体

从本章开始，我们将深入探讨ChatGPT的训练过程，通过实践案例，让读者学习如何利用ChatGPT提高办公效率。ChatGPT作为一种大型语言模型，通过不断接收和处理各类输入数据来学习和提升自身的能力。那么，为什么我们需要对ChatGPT进行训练呢？原因在于自然语言的复杂性，不同的语境和表达方式会对ChatGPT的理解和应答产生不同程度的影响。因此，通过训练，ChatGPT能够不断提高自己的智能水平和语言处理能力。

为了实现这一目标，我们选择将编程作为ChatGPT的主要训练载体。编程语言具有严谨性、规范性和逻辑性，这些特点有助于ChatGPT更加深入地理解和运用语言知识，从而加强其语言逻辑能力和表达能力。此外，编程没有模棱两可的答案，这使得我们在训练过程中能够更加明确地评估训练效果。

2.1 为什么ChatGPT这类AI工具需要训练

正如我们在前面提到的，ChatGPT提供的答案取决于所提问题的水平以及“投喂”语料的水平。此外，对于提问模糊或不了解的领域，ChatGPT会给出一些符合通用规律但实际上完全错误的答案，而且它的表现非常自信。这就是我们在使用类ChatGPT产品时，需要对其进行训练的原因。

那么如何训练ChatGPT，使其能提供优质且符合我们需求的答案呢？

在回答这个问题之前，我们先了解一下ChatGPT工具是如何被训练出来的。此前，ChatGPT官方网站提供了ChatGPT的三步训练流程图，如图2-1所示。

（1）监督学习： 为了让ChatGPT能够学会正确回答问题，科学家们首先请来了“提示词工程师”思考问题并提供高质量的答案。接着，将这些人工标注好的数据输入到ChatGPT中，使其了解人类的喜好，并模仿学习。

（2）训练奖励模型： 在这个阶段，“提示词工程师”对生成的答案进行评分和排序。工程师们收集了大量的人工标注数据集，包括问题、正确答案和人类对答案的评分，用以训练ChatGPT。通过为每个答案提供评分反馈，ChatGPT逐渐学会理解人类的深层意图，并优先选择得分较高的答案。

（3）强化学习-自我进化： 在此阶段，ChatGPT会自动检查学习成果并进行调整。在新数据集上进行验证，根据验证结果进行调整和更新。通过不断迭代训练，ChatGPT的性能逐步提升，最终成为一个越来越聪明的“机器人”。

图2-1

我们的目标不是成为人工智能专家，而是简单了解ChatGPT的运行原理，以便更好地利用这个工具。我们在使用ChatGPT时，可以利用这个思路对prompt（提示词）进行限定训练，从而帮助ChatGPT更加精准地回答问题。

（1）提示描述

通过使用prompt，用户可为ChatGPT指定需回答的问题类型、主题，同时提供关键词和背景信息，从而帮助其更好地理解问题。例如，对于问题“什么是量子力学？”，prompt可设为：“请用简单的语言解释量子力学的基本原理和应用。”这样，ChatGPT便能更准确地回答问题。在问答系统中，用户可设置prompt以引导ChatGPT回答特定类型的问题，例如：“请根据以下句子回答问题：xxxx。”这将使ChatGPT更专注于解决该类问题，并给出更准确的答案。

（2）随时调整

用户还可根据ChatGPT的回答情况随时调整prompt，以便更好地引导其回答问题。例如，若ChatGPT的回答未触及问题关键点，用户可通过prompt要求其重新回答问题；若回答冗长或令人难懂，可修改prompt，使答案更简洁、易懂。在翻译系统中，用户可在prompt中提供目标语言的结构和语法规则，以帮助ChatGPT更好地翻译句子。例如，将中文句子翻译成英文时，prompt可包含英语的正确语序和语法规则，以提高翻译的准确性。

（3）强化训练

用户可利用强化训练方式，通过对ChatGPT回答的质量进行评分，从而提高其回答问题的准确性。如在聊天机器人应用中，若ChatGPT的回答获得积极反馈，系统可给予更高分数的奖励，助其更好地理解和回答问题。在写作助手场景中，用户可在prompt中提供示例文本，引导ChatGPT撰写更优质的文章。例如，输入标题并在prompt中提供若干例句，指导ChatGPT保持一致的风格和语气。

（4）根据需求多“投喂”

用户可根据需求多样化地“投喂”，从而提升ChatGPT的回答精度和效率。如在医疗问答应用中，若想让ChatGPT更好地理解医学术语或回答特定的问题，系统可提供更多针对性的训练数据，助力ChatGPT学习并精准回答问题。在自动化客服场景中，用户可设置prompt，以帮助ChatGPT更好地理解用户的问题并给出准确的答案。例如，用户可以在prompt中提供常见问题的示例，并告诉ChatGPT如何分类和回答这些问题，以提高客服的效率。如图2-2所示。

图2-2

综上所述，利用prompt限定训练可提高ChatGPT理解与回答问题的效率。而利用随时调整、强化训练和多样化的“投喂”等方法，则有助于ChatGPT更好地学习并适应不同类型的问题，从而提升回答的质量。

点击中间区域
呼出菜单

购买书籍时，会优先扣除您的代金券，再扣除阅饼；当您的余额不足时，可使用微信或支付宝支付，补足差价；
连载书籍勾选自动购买下一章后，会自动扣费，已购章节不会重复扣费；
书籍购买记录请至我的—购书记录中查询

上一章

目录

下一章

×