2022年11月底,OpenAI发布了ChatGPT,它是一个基于GPT-3.5体系架构的大型语言模型,相较于其他语言类AI应用拥有更加强大的文本处理能力。
ChatGPT具有大量的预训练参数,能够涵盖广泛的知识领域,并可以通过自我学习和不断优化拓展自身的知识深度和广度。因此,它在多个领域都能发挥作用。并且它可以通过定制和模型微调参数,满足不同用户、不同场景的需求,比传统的语言模型具有更高的灵活性和可定制性。
ChatGPT的语言表达能力更接近人类,它可以生成更加流畅自然的文本,包括文章、对话、摘要、翻译等多种形式。此外,ChatGPT有极强的文本交互能力,可以与用户进行多轮对话,能够准确理解和回答用户的问题。它还可以依据用户提供的信息,结合上下文来回答问题。同时,它能够通过语言实现逻辑推理,但其在数理推理方面的能力较弱。相较于其他的语言模型,ChatGPT已经能够实现更加智能化的人机交互。
作为一个语言类AI,ChatGPT的文本处理能力非常强大,它可以根据用户需求进行非交互式写作,在诸如翻译等辅助性写作方面的表现也十分优秀。本节将用多个实际例子来说明ChatGPT在不同场景中的表现。
文本创作主要包含结构化写作和非结构化写作。其中,结构化写作是指按照一定的格式、规则或标准,进行有较强逻辑性的写作。结构化写作要求文章条理清晰,易于阅读和理解。常见的结构化写作包括标准化的政策性文件及规范性文件,如:公文、法律文件及公司的行政法规等;需要向读者传递信息的新闻稿件及咨询报告等;需要对现有知识及成果进行综合归纳和系统阐述的教科书、科普类写作等;以及需要对比较复杂的工作做出规划及部署的计划性公文、策划案等。此外,在工作场景中的邮件及工作总结等也属于结构化写作。
非结构化写作则是一种没有明确大纲或组织框架的写作方式。它以文字为载体来表达作者的个人意识,以一种更艺术的形式来传递思想、营造氛围,以写意的方法激发读者的想象力。它强调的是创造性和自由表达,作者可以自由地发挥想象力。极具艺术创造性的散文、诗歌、小说及富有创意的广告文案等都属于非结构化写作。
结构化写作需要确定写作的目的以及预期的读者群体,以决定文本内容的组织方式、语言风格和所需资料的详细程度。结构化写作强调使用简单、清晰的语言表达观点和想法,以确保文本易于阅读和理解,并且要确保文本的逻辑性和连贯性。ChatGPT在结构化写作上的表现非常亮眼,它能在很短的时间内生成逻辑连贯的结构化段落或文章。
图1.2是使用ChatGPT生成的新闻稿件。在对ChatGPT发出“请写一篇关于ChatGPT的新闻播报”的命令后,它快速生成了一篇标准的新闻稿。整篇稿件的逻辑性较强,包含了引言、背景,表达了较为中立的观点并做了总结。
图1.2 ChatGPT示例:撰写新闻稿件
图1.3展示了使用ChatGPT撰写产品推广方案的示例。ChatGPT可以迅速从市场需求入手,抓住目标客户,强调产品卖点,引导客户消费,最终生成粉底液的推广文案。该文案结构清晰,但语言不太符合当下社交媒体的文案风格。
图1.3 ChatGPT示例:撰写产品推广方案
虽然ChatGPT是一个自动化工具,但它并不能完全替代人类的写作。在撰写有特定目的和目标受众的文本时,ChatGPT需要用户提供更具体的需求命令,才能生成更精确的文本内容。
图1.4展示了ChatGPT在工作场景中撰写英文工作邮件的示例。工作邮件需要遵循较为规范的书写格式,且要注意语气和措辞。只要准确告知邮件需要包含的内容,ChatGPT就可以快速生成标准格式的商务邮件。
图1.4 ChatGPT示例:撰写工作邮件
非结构化写作可能会导致文本的逻辑性较差,特别是意识流写作,会使读者难以直观地理解文本意思,因为它不具备明确的逻辑顺序和清晰的结构。它是一种较为自由和开放的写作方式,强调创造性、艺术性及表达自由性。ChatGPT同样可以进行逻辑性较弱但富有创造性的非结构化写作,如小说、诗歌、散文等。
图1.5是ChatGPT写的一个武侠小说的梗概,故事围绕着一个叫李飞雪的少侠展开。虽然ChatGPT生成的小说梗概拥有完整的故事线,但情节略为老套,可以看出是依据较热门的武侠小说模式来撰写的。但是,ChatGPT能够理解“武侠小说”的含义,并仿照中国武侠小说的故事发展模式创造出小说梗概。对语言类AI来说,这在非结构化写作上已经有了质的飞跃。
图1.5 ChatGPT示例:撰写小说梗概
相较于更注重故事情节和角色刻画的小说,诗歌的语言更为抽象化,它是一种更注重意象表达的文学形式。诗歌强调表现诗人的内心情感和思想,而对没有人类情感的AI来说,诗歌创作更多的是模仿诗歌的写作结构和语言风格,在意象和情感的表达上缺乏艺术性。图1.6是ChatGPT创作的一首赞美春天的现代诗。在生成诗歌文本时,ChatGPT遵循了现代诗的写作结构,但在意象的表达上较为简单直白。
相较于现代诗,中国的古诗词更讲究“只可意会,不可言传”的意境美,具有高度凝练的语言艺术魅力。图1.7是ChatGPT创作的一首七言绝句。它能够理解“七言绝句”的含义,并依照每首八句,每句七字的标准格式生成文本。
图1.6 ChatGPT示例:撰写现代诗
图1.7 ChatGPT示例:创作七言绝句
除了对逻辑性要求较高的结构化写作及需要富有创造性的非结构化写作,ChatGPT在辅助性写作上的能力更为突出,如它在多语言翻译、修正语法错误、改进文章措辞及归纳总结文章含义等方面表现优秀,可以辅助用户高效地完成文本创作。
在ChatGPT出现以前,语言类AI在中英文翻译上的应用已日渐成熟。谷歌翻译(来自美国)和DeepL翻译(来自德国)都是AI翻译领域中比较有代表性的应用。图1.8节选了维基百科中关于AI的英文介绍,对比了谷歌翻译及ChatGPT翻译的结果。
AI applications include advanced web search engines(e.g., Google Search), recommendation systems(used by YouTube, Amazon, and Netflix ), understanding human speech(such as Siri and Alexa ), self-driving cars(e.g., Waymo ), generative or creative tools(ChatGPT and AI art ), automated decision-making, and competing at the highest level in strategic game systems(such as chess and Go ).
Artificial intelligence was founded as an academic discipline in 1956, and in the years since it has experienced several waves of optimism, followed by disappointment and the loss of funding(known as an "AI winter" ), followed by new approaches, success, and renewed funding. AI research has tried and discarded many different approaches,including simulating the brain, modeling human problem solving, formal logic, large databases of knowledge, and imitating animal behavior. In the first decades of the 21st century, highly mathematical and statistical machine learning has dominated the field, and this technique has proved highly successful, helping to solve many challenging problems throughout industry and academia.
图1.8 谷歌翻译与ChatGPT翻译对比
谷歌翻译与ChatGPT在翻译简单句子时没有太大的差异,但在长句、难句的翻译上,ChatGPT翻译得更通顺,语言表达更自然。如图1.8所示,对于多个并列句的翻译,谷歌翻译的措辞略微重复且对英文被动语态的翻译不够准确。
“…… 随后 是失望和资金流失(被称为‘AI冬天’), 随后 是新方法、成功和 重新资助 ……”相比于谷歌翻译,ChatGPT翻译的语言就流畅许多,“……多年来经历了几次乐观、失望和资金损失(被称为‘AI冬天’),然后是新的方法、成功和重新获得资金……”在同一个句子中,避免了重复措辞,并且对英文被动语态的翻译较为准确。
润色指的是对文本、文章或其他写作内容进行修改、编辑的改进过程。它包括查错,修改语法错误、句子结构,增加或删减内容,以及改变整体写作风格和提高流畅度等方面的工作。润色可以提高文本的质量,使文本更具可读性,让读者能够更容易理解文本所传达的信息。
图1.9为使用ChatGPT修改谷歌翻译结果的示例展示。Chat-GPT纠正了并列句重复措辞的问题,润色后行文更加流畅。
图1.9 ChatGPT示例:润色修改文章
图1.10中展示的是使用ChatGPT修改中文病句的示例。示例中的中文语句涵盖了常见的语病,如句子成分残缺、词语搭配不当、重复措辞、滥用副词及语义前后矛盾等。可以看出,ChatGPT可以修改大部分的中文语病。但在图1.10中,第一句话成分残缺的问题没有修正,在ChatGPT修改后的句子中,依然缺少主语。
图1.10 ChatGPT示例:修改中文病句
图1.11展示的是使用ChatGPT修改英文病句的示例。相较于对中文的润色,ChatGPT在英文文本修改上表现出更加出色的能力。示例中的6句英文涵盖了过度使用副词、过多的介词短语、语义不明、错误用词、指代不明及逗号使用错误的问题。可以看出,ChatGPT可以修改上述语病,且行文流畅自然。
总的来说,ChatGPT可以高效地帮助用户修改文章,且其处理英文文本的性能更强。
图1.11 ChatGPT示例:修改英文病句
除了能够对文章进行修改,ChatGPT还可以辅助用户对文章的大意进行总结。在图1.12的例子中,输入一段1 300多字介绍故宫历史的文本,然后,命令ChatGPT用300字总结文章的大意。可以看出,ChatGPT能够使用逻辑清晰且流畅自然的语言总结出文章的内容。
故宫,又称紫禁城,是明清两朝二十四位皇帝的皇宫。故宫始建于明成祖永乐四年(1406年),永乐十八年(1420年)落成。位于北京中轴线中心的故宫,占地面积106.09万平方米,建筑面积约23.33万平方米,是世界上现存规模最大的宫殿建筑群。故宫是第一批全国重点文物保护单位、第一批国家5A级旅游景区,1987年被选入《世界文化遗产》名录。故宫现为故宫博物院,藏品主要以明、清两代皇宫和宫廷收藏为基础,是国家一级博物馆。
明初定都于应天府(今南京)。建文元年(1399年),燕王朱棣自北平(今北京)起兵,发动靖难之役。永乐元年(1403年),朱棣颁诏改北平为北京。从永乐元年至三年,明成祖朱棣多次下令从各地迁入人口至北京。永乐四年(1406年)闰七月,朱棣颁诏“以明年建北京宫殿”,永乐五年开始营建紫禁城。宫殿和宫墙由潭柘寺的无名和尚设计,泰宁侯陈珪、工部侍郎吴中、刑部侍郎张思恭主持工程营建。以北方工匠为主体的大量营建工匠,包括部分南方工匠,如著名的石工陆祥、瓦工杨青等,在永乐五年五月到达北京。建造紫禁城和改造北京是同时进行的,以原来的元大都城为基础改建。紫禁城工程开始后不久,受到长陵建设及永乐八年、十一年两次北伐蒙古战役影响,营建速度放慢,至永乐十六年六月方才开始重新开工。
永乐十八年(1420年)十一月,朱棣发布诏书,宣告北京宫殿竣工。次年正月初一日,朱棣在奉天殿(今太和殿)接受朝贺,由此开启了紫禁城自明至清的使用历史。同年五月遭雷击,发生大火,前三殿被焚毁。正统五年(1440年),重建前三殿及乾清宫。天顺三年(1459年),营建西苑。嘉靖三十六年(1557年),紫禁城大火,前三殿、奉天门、文武楼、午门全部被焚毁,至嘉靖四十年(1561年)才重建完工。万历二十五年(1597年),紫禁城大火,焚毁前三殿、后三宫。复建工程直至天启七年(1627年)方完工。
崇祯十七年(1644年),李自成军攻陷北京,明朝灭亡。未几,明朝山海关总兵吴三桂引清兵入关,击败李自成。李自成向陕西撤退前焚毁紫禁城,仅武英殿、建极殿、英华殿、南薰殿、四周角楼和皇极门未焚。同年清顺治帝至北京,以皇极门为常朝场所,以未被焚毁的建极殿为位育宫,作为顺治帝寝宫,摄政王多尔衮在武英殿办公。顺治元年(1644年)至顺治十四年,重建了午门、天安门、外朝前三殿,将位育宫改名为保和殿(顺治二年),又整修内廷、东路和西路的建筑。康熙六年(1667年)重建端门。康熙二十二年(1683年),开始重建紫禁城其余被毁的部分建筑。1735年乾隆帝即位,此后的六十年间对紫禁城进行了大规模增建和改建。嘉庆十八年(1813年),林清率天理教教众攻打紫禁城。光绪十四年(1886年)太和门护军值班房发生火灾,由于救火设施不完善,大火烧了两天,贞度门、太和门、昭德门被焚。此次损坏直到光绪二十年才修复完毕。
1912年清帝溥仪退位,但仍居于宫内。1924年冯玉祥与胡景翼、孙岳在北京发动北京政变,推翻了曹锟反动政权,12月5日,黄郛主持召开摄政内阁会议,修改《清室优待条件》内容,根据第五条规定,废除皇帝尊号,请废帝溥仪出宫。政府代表李煜瀛、京师警卫司令鹿锺麟、警察总监张璧,于6日接管皇宫,封存文物。后经摄政内阁核准,经一年之整理,故宫博物院于1925年10月10日正式成立。
2012年,故宫单日最高客流量突破18万人次,2019年全年客流量突破1900万人次,可以说是世界上接待游客最繁忙的博物馆。2013年5月18日起,故宫博物院范围内严禁明火,全体员工、在院合作单位和游客,不管在室内和室外,不分开放区与工作区,一律禁止吸烟、禁用明火。
图1.12 ChatGPT示例:段落总结
注:图中ChatGPT将故宫博物院的成立和现状总结成“民国时期修葺历史”并不准确。
除了生成和处理文本,ChatGPT还具备输出表格的能力。图1.13展示的是用户命令ChatGPT生成“2011—2020年中国的GDP数据表”的示例。ChatGPT不仅具备生成表格样式答案的能力,也具备自动检索数据的能力。回答中的GDP数据并不是用户告知ChatGPT的,而是它在得到用户指令后,自己搜寻,并以表格的形式展示出来的。
图1.13 ChatGPT示例:生成表格
从图1.13可以看出,ChatGPT给出的结果与中国国家统计局发布的官方数据是有出入的。由此可见,ChatGPT的回答并不总是准确的。因此,当进行诸如写论文、做数据分析等对准确性要求较高的工作时,用户需要进一步考证ChatGPT结果的准确性。
ChatGPT不仅可以很好地完成各种基础的语言类任务,也可能取代部分程序员的工作。换句话说,ChatGPT可以根据用户输入的文字请求,编写相应的代码。ChatGPT的代码生成能力可能会引发互联网行业的变革。在未来,或许初级程序员的岗位将会被AI取代。
如图1.14所示,用户要求ChatGPT用Python语言编写一个弹球游戏的代码。从ChatGPT生成的代码质量来看,它不像一个资深的“码农”,因为代码质量有很大的提高空间,但它足以承担各种重复性的代码编写任务。
图1.14 ChatGPT示例:弹球游戏代码
ChatGPT生成代码的能力离不开互联网中海量代码数据的支撑。如果ChatGPT真的取代了程序员去完成各种代码编写任务,也会带来一个问题:在未来,ChatGPT学习所用的代码数据是由ChatGPT自己生成的,这合理吗?如果没有合适的评定数据的方法,那么在取代程序员后,ChatGPT将面临没有任何数据可用于学习的困境。不仅是代码,文本数据也是如此。因此,在ChatGPT取代人类工作之前,如何持久地获取有效数据是首先要思考的问题。
总而言之,ChatGPT不论是在文本任务还是代码任务上都表现出极强的能力,大有取代人类的趋势。如果没有正确引导的话,ChatGPT的出现可能导致各行业更加剧烈的“内卷”。或许ChatGPT的出现是出于让人们进一步提高生产力的目的,但它也需要正确的引导,从而真正成为帮助人们提高效率的工具,而不是成为“内卷”的背后推手。