1.背景信息的三个层次:模型信息、公域信息和私域信息
我们知道,背景信息是提升内容输出质量的关键。那么,问题来了:究竟要提供什么类型、什么性质的背景信息,才能有效地提升输出结果的质量呢?
要回答这个问题,首先需要了解背景信息的三个层次。为了方便理解,我们把它们划分为模型信息、公域信息和私域信息。
(1)模型信息。这是指在ChatGPT训练阶段,已经包含的训练数据信息。这些信息已经作为预训练的知识内置在模型中。当我们没有提供任何背景信息时,ChatGPT会直接用这些模型信息回答问题。
(2)公域信息。这是指除模型信息以外,在公开渠道中可以获取的信息。这些信息既包括通过互联网、公开出版物等渠道获取的公开信息,也包括动态的行业新闻、公告等信息。
(3)私域信息。这是指除模型信息、公域信息以外,世界上存在但并未公开传播的信息。比如,一些未公开的个人观点,企业或机构的内部资料,以及一些未公开的行业调研信息等。
背景信息的三个层次
这三个层次的信息,是互补的关系。了解了背景信息的层次,就可以理解为什么有时候ChatGPT的表现会低于预期。常见的原因是,我们提出的问题可能已经超出了ChatGPT自身包含的信息,而我们又没有给出有效的补充。比如,当我们询问最新的新闻或天气预报时,ChatGPT无法回答,这些信息并没有包含在其训练数据中 。又比如,当询问ChatGPT一些行业知识时,ChatGPT可能会对行业的隐性知识缺乏理解,这是因为很多“行话”只在行业小圈子里口口相传,并未被明文记录。
这也意味着, 补充背景信息并不意味着补充更多的信息,而是补充模型信息以外的必要信息 。如果将通用的知识再输入给ChatGPT,并不会带来输出质量的提升。我们真正需要做的是,从预期的内容输出出发,有针对性地补充公域信息或者私域信息。
2.通过补充背景信息,提升输出质量
在上文的示例中,我们已经向ChatGPT提出了一个结构完整的要求。在这个基础上,我们可以进一步补充公域信息和私域信息,来生成更符合当下场景的方案。
1)补充公域信息:ChatGPT与世界人工智能大会背景
要举办一个怎样的AI医疗主题会议呢?我们可以结合2023年的两大热点,一是ChatGPT的技术浪潮,二是年度的世界人工智能大会。
ChatGPT生成的一份会议策划方案(补充公域信息后)
重新输出的策划方案,已经很好地结合了“ChatGPT”“世界人工智能大会”等热点主题,并设置了相关的议程。
2)补充私域信息:客户需求调研信息
假设经过调研,我们了解到参会客户的关注点有:ChatGPT在诊疗全流程的应用、AI技术在基层医疗机构的应用。这些信息是非常宝贵的私域信息,可以让ChatGPT结合调研信息给出更有针对性的方案。
ChatGPT生成的一份会议策划方案(补充私域信息后)
在上面的例子中,私域信息的补充,比如客户需求调研数据,就是这个定制化过程中的关键因素。ChatGPT根据这些私域信息,将原本通用的会议策划方案,转变为一份针对特定客户、特定需求的定制化方案。议程安排、会议主题、讨论议题等,都围绕客户的关注点进行设计,从而让策划方案更有价值和意义。
私域信息的补充,实质上是对内容输出进行了定制化设计,使得ChatGPT生成的内容不再千篇一律,而是充满了个性化和独特性,满足了我们对高质量、有价值的内容的追求。每一次加入新的私域信息,都意味着可以生成一个全新的、定制化的内容版本。这个过程就好像在打造一件定制的艺术品,每一次调整都使得结果更加符合客户的需求。