购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一章
人工智能和AIGC概况

1492与人类的星辰大海

当历史的时钟拨回到五百多年前的1492年,哥伦布在经过多年的筹备后,终于开启了他心心念念的航行。这次航行,既是旅程,又是冒险,更是人类历史的新篇章,恐怕哥伦布自己一开始也不清楚,地理大发现时代在悄然降临。

五百多年后的今天,人类再次站在了命运的十字路口,眺望前方。但是不同往昔,今天的我们拥有更加先进的技术:通信网络让信息快速传递,我们能够足不出户便知天下事;发达的交通让物理距离不再是难题,我们可以乘坐飞机前往大洋彼岸;信息的爆炸和公共知识的传播让我们不断扩展人类的能力边界,终身学习和自我提升成为这个时代的重要议题。

只是,当前沿技术降临的时候,我们是否做好了准备?2022年席卷全球的ChatGPT,带给人们的不仅仅是一个人工智能聊天工具,或是用于辅助写文稿、写代码的办公小工具,这一热潮带来的是对人工智能的思考:现在我们是否再次经历着1492年的新篇章?人类历史长河的厚重故事,将如何继续?

1492年开启的大航海时代,让我们心里有了新大陆的概念,之后航海技术的进一步发展,不同国家贸易、文化、经济交流更加紧密,全球化在改变人类的命运。五百多年来,技术的进步极大地提高了历史生产力。此后,生产关系的变化,让全球社会经济结构发生系统性的改变。在这个过程中,各路英雄在历史舞台上“你方唱罢我登场”,多少跌宕起伏、悲欢离合的故事不断发生。这就是技术带来的变革。

到了智能时代,科学技术依然如同汽车的引擎,推动着人类前行。但这一次,恐怕和以往都不一样。20世纪50年代,计算机科学之父艾伦·图灵开始考虑一个问题“机器是否能思考”,而七十年后的今天,普通网友都在讨论“人工智能是否能取代人类”“人工智能是否会产生新的社会问题”。这就是技术的力量,当世界发展格局改变的时候,我们每个人都身处其中,被技术的进步推着向前,而我们每个人本身也是历史的创造者和书写者。

在人工智能时代,引领我们前行的不再是哥伦布这样的领航人或开创者,而是我们自己。我们每天产生的数据成为大模型训练的“养料”,让人工智能不断吸收并进化,从而变得更加聪明;深度学习技术不仅让机器具备学习能力,而且学习和进步的速度也在不断提升——这是最让人激动又担心的地方。我们开始思考人工智能的应用场景和技术边界,一方面我们在探索人工智能在哪些领域能够更好地应用,以此创造更多的经济社会价值,让日常生活和工业生产变得更加方便;另一方面我们也担心人工智能过于聪明,是否会替代一部分现有工作岗位,是否会产生思维冲突甚至伦理问题。

就像1492年开启的航海时代的探索一样,这一次,我们向人工智能带来的新领域出发。

计算机和互联网

计算机发展之路

人类历史上所有新技术的诞生都不是一蹴而就的,它是长期生产实践和总结客观规律的必然结果。第一次工业革命时期,新技术的产生往往靠工匠和手艺人在长期劳动中的实践,而到了第二次工业革命时期,技术的进步就开始与科学结合起来了。自然科学,作为人类思维的结晶,是历史长河中对客观事物规律的观察、总结、研究,并且进行抽象化的概括和描述,形成了系统化的集合。这种研究、概括、总结形成体系的能力,是人类作为智慧生物的独特优势。

计算机的出现,就是人们基于自身对计算的需求,在数学、逻辑等方面长期探索的结果。1822年6月14日,英国数学家查尔斯·巴贝奇发布了名为《论机械在天文及数学用表计算中的应用》的论文,提出了“差分机”的概念。查尔斯·巴贝奇的差分机也并没有成功,但用机械来进行数学计算的思想却对后世产生了深远影响。1843年瑞典发明家佩尔·乔治·舒茨(Per Georg Scheutz)在此基础上,成功制作了一台支持5位数、3次差分的差分机,之后又制成了两台支持15位数、4次差分的机器。之后,多国科学家都成功制作出了差分机。

1936年图灵发布了著名的论文《论可计算数及其在判定问题上的应用》,提出了著名的“图灵机”设想。图灵机的思想为后世计算机语言和逻辑奠定了基础,因为它模拟人类手写输入的计算过程,厘清了哪些问题能够通过计算机来解决。通过一台图灵机,将另一台图灵机的编码输入的过程,类似于如今的计算机编程语言,因此图灵机是现代计算机的理论原型。

1946年冯·诺依曼发布了《关于计算机逻辑设计的报告》,提出了“冯·诺依曼架构”。他的理论首先提出了二进制的思想,大大提高了计算机的运算速度;其次囊括了计算机的五大组成部分,即运算器、控制器、存储器、输入设备和输出设备,为计算机的制造奠定了明确的框架。另外冯·诺依曼架构提出计算机的运作逻辑:存储器的作用类似于一个仓库,计算机的程序、数据和指令序列存放在里面,当计算机工作时,便从中迅速提取、分析和使用。

冯·诺依曼架构为计算机科学的发展带来深远的影响。首先在计算机设计和开发方面,冯·诺依曼架构提供一种通用的范式;其次为编程语言和编译器的发展提供了思路,将程序和数据储存在同一个内存中,让程序也可以得以处理。后来在冯·诺依曼架构的基础上,其他计算机架构也慢慢出现,比如向量计算机、并行计算机和分布式计算机等。从学科和理论发展的角度看,冯·诺依曼架构也推动了计算机科学和算法的发展。冯·诺依曼的贡献,不仅在于提供了一种新的方法论,更在于对计算机的整体逻辑进行了系统性的思考,让计算机技术之“术”,变成了一种思维方式。

从整体上来看,现代计算机的发展历程可以简单划分为五个阶段:第一阶段是1940年之前的机械计算机时代,以上文我们提到的巴贝奇的差分机为代表,这是一种简短的、原始的数字计算;第二阶段是20世纪40—60年代的电子计算机时代,这一时期出现了以电子管和晶体管为基础的电子计算机,其计算能力得到了一定程度的提升;第三阶段是20世纪70—90年代,集成电路技术带来了新的计算机形式,个人PC诞生并且有了一定的商业化态势;20世纪90年代后,互联网经过了一定探索期,进入了商业化时代,此时计算机进入了第四阶段,即网络计算机时代,以互联网通信功能为核心,计算机的应用快速扩展,并加速了计算机整体的商业化;到21世纪后,由于通信技术的进一步提升和网络的普及,带来了更多元化的需求,计算机不再只是电脑,更多的移动设备开始出现,由此计算机进入了移动时代。

现代计算机的发展历程,代表着人类从工业时代向信息时代迈进,这一过程是颠覆性的,同以往的工业革命完全不同,如果我们从更加宏观的维度去思考,就能够深刻地理解这一点。纵观科学技术发展史,人类一开始使用火种、工具,学会耕种和养殖,是为了适应自然环境。随着生产力的提升,人类的组织形态发生了改变,村落、城镇慢慢出现,新的问题和需求出现,于是更多的适应当时社会经济条件的技术产生。因此,技术实际上是新需求推动的新发展。在计算机发明之前的技术,往往出自于生存型的需求,其应用场景也具备看得见、摸得着的实物,而计算机的诞生代表的是人们更加抽象的需求:让机器参与人的思维过程,处理更加高维度的需求。

实际上,早在1950年,图灵就开始思考“机器能否思考”的问题,并且对“机器”和“思考”分别进行了定义。人工智能也在计算机诞生的早期就已经萌芽,只是受技术水平的限制,当时还无法进行更加深入的研究,因为在人工智能正式进入发展快车道之前,人们对计算机的使用需要解决一个更加明确的问题——通信,也就是将一个个单独的计算机连成网络,让它们彼此之间能够沟通、交流,让信息能够在彼此之间顺利的传递。这就是互联网诞生的基因。

互联网:计算机发展新生命

1969年10月29日阿帕网(arpaNET)的诞生,标志着人类对计算机的认识和使用到了另一个新阶段——互联网时代。阿帕网可以看成是互联网的原型。20世纪60年代,在对计算机科学已经有一定研究的基础上,科学家们提出了分组交换网络的概念,即将数据分成不同的数据包,并通过网络节点进行传输,这成为阿帕网研发的核心思路。1969年,阿帕网的四个节点分别在加利福尼亚大学洛杉矶分校(UCLA)、加利福尼亚大学圣芭芭拉分校(UCSB)、斯坦福研究所(SRI)和犹他大学(University of Utah)成立,标志着全球首个分布式计算机网络诞生。两年后,计算机工程师雷·汤姆林森以阿帕网为基础开发测试程序时,想到在不同计算机之间发送信息,于是创建了以@符号为格式的地址,并成功将“QWERTYUIOP”发送了出去。世界上第一封电子邮件就此诞生,世界的联系从此更加紧密。

到了20世纪80年代,人们对计算机网络信息传输的认识更加深入,计算机网络传输协议的概念从而诞生。简单来说,在最早的计算机时代,每个公司生产的机器都不同,彼此之间信息不能互通,而当网络传输协议诞生后,不同计算机之间的交流规则和逻辑得到定义,只要支持同一种交流规则的计算机,就能够实现沟通。比如TCP/IP协议,全称为Transmission Control Protocol/Internet Protocol,传输控制协议/互联协议。该协议分为四层:网络访问层、网际互联层(主机到主机)、传输层和应用层,每一层与下一层互相配合,以完成传输任务。TCP为数据的传输过程提供检测和保障,一旦发现问题就重新传输,而IP是计算机联网时分配的地址,就好像邮递员要将信件送达,需要一个准确无误的地址。

计算机网络传输协议的诞生,在计算机和互联网发展史上留下了浓墨重彩的一笔,因为它不仅实现了不同计算机之间的沟通,同时能够保证数据在传输过程中不会丢失。计算机网络传输协议不仅仅包括TCP/IP协议,还有HTTP协议、SMTP协议、FTP协议、DNS协议等。通过这些协议,互联网实现了更多功能的应用,例如Web浏览器、电子邮件、文件传输、远程登录、实时通信、数据库管理等。

20世纪80年代,互联网虽然已经诞生,但是并没有完全商业化,也没有足够的应用场景。而到了90年代,互联网进入百花齐放时期。1989年3月,科学家蒂姆·伯纳斯·李(Tim Berners-Lee)开发出了世界上第一台Web服务器和第一台Web客户机,后来命名为万维网,也就是我们熟知的WWW,并于1991年正式推出。互联网开始逐步走入商业世界和大众视野。

这一时期,互联网开始商业化,社会大众的需求被激发,更多互联网服务和业态产生,形成了互相促进的良性循环。20世纪90年代诞生了许多全球性的互联网公司,比如美国的亚马逊、谷歌、Yahoo!、Paypal,中国的腾讯、百度、阿里巴巴等。Jerry Yang和David Filo创建的雅虎(Yahoo!)曾经是全球第一门户网站。门户网站在当年是全新的互联网形态,人们可以在一个网址上找到各类综合性信息和功能,包括搜索引擎、邮件、新闻、各类分类信息等。门户网站的出现,展现出了互联网世界信息爆炸的趋势。

而90年代互联网行业中另一标志性事件,则是1995年8月9日网景公司成功IPO,其股价由开盘时的28美元,在一分钟以内上升到了70美元,最终收盘于56美元。当年《华尔街日报》评价说,通用公司以43年时间的发展,使其市值达到了27亿美元,而网景只花了1分钟。1997年,微软以4亿美元收购了Hotmail,彼时这家年轻的公司成立不足2年,规模只有26名员工。互联网让以往不可能发生的事情,全部变成了可能。

互联网的发展历程,是人们对计算机探索和应用的进一步升级,也是计算机发展了30年之后一次明确的转型升级,社会的信息化趋势已经势不可当。21世纪初,互联网泡沫事件发生,盲目的投资和不理性的资本涌入造就了高涨的股价,市场上泡沫被越吹越大。2000年3月10日纳斯达克指数创下了历史新高,此后却开始狂跌,这让爆炸式发展的互联网行业进入了至暗时刻。不过在大浪淘沙后,互联网公司、投资者等都对互联网进行了新的反思:互联网到底给我们带来了什么?

事实上,互联网在经过商业化的浪潮之后,已经不仅是将计算机连接起来、实现沟通的一种工具和方式了,它开始以一种更加深刻的方式渗入社会的各个角落,以新的方式提升生产力和改造生产关系。尤其是2009年之后,智能手机的快速发展将互联网时代推向了移动互联网阶段,在需求端更加便携的网络设备让互联网变得更加日常化、碎片化,而在供给端,更多元的需求造就了各类网络服务应用和全新业态。这个阶段主要呈现出以下几个特点:

第一,社会整体的信息沟通效率提升,成本降低。互联网时代,实时通信技术普及、资费降低、速度变快、通信更加稳定,各个领域的通信能力全面提升。同时,信息的传播模式和信息的内容也发生了根本性的改变。90年代的门户网站起着信息展示和传递的作用,搜索引擎算法的优化让人们从被动接收信息变成主动寻找信息。社交网络和视频平台的诞生,让网民的角色进一步升级为内容的生产者和创造者。

第二,互联网开始与传统行业相结合,并对其进行改造和升级,新的商业模式和业态产生。比如传统的商贸与互联网结合,形成了电子商务,人们只需要在网上选择商品和下订单,物流就会进行配送。商业的本质并没有改变,依旧是货币和商品的价值交换,但互联网平台改造了这个流程,简化了前端选购的部分,提高了整体效率。同时线下的物流和供应链环节,也随着电子商务的发展需求进行了提升和改造。在这个过程中,互联网不仅仅是平台工具,更是生产力改造方式。

第三,人们对互联网依赖程度极大提升,互联网已经开始成为社会的基础设施。在日常生活层面,互联网和人们的衣食住行紧紧结合在一起,部分生活服务几乎都可以通过手机客户端解决。而在更加基础的生产端,工业互联网在深度改造工业生产和管理流程,通过设备、传感器、生产设施等工业设备之间的互联互通,实现了更高效的生产。比如智能制造等,以互联网为底层技术,将硬件联系和协同起来,实现自动化、柔性化和智能化的生产,让生产和销售的对接更加精准。

第四,围绕互联网应用和服务,新需求推动新的细分产业、新的职业诞生。比如网络安全行业,在互联网产业规模扩大之后,网络数据和信息的安全成了刚性需求,包括网络安全的标准、策略,信息保护的手段、机制,网络风险的防范化解和预测以及围绕其产生的法律法规,已经上升到社会治理的一部分。而职业层面,程序员、网络工程师等相关职业需求不断提升,尽管这些职业的诞生可以追溯到计算机和互联网早期,但随着互联网的快速发展,对这些技术性人才的需求与日俱增。相对应地,学校和社会对于这些人才的培养体系也发生了变化,这就是互联网推动社会变革的具体体现。

在互联网时代,信息的传播和社会的变化越来越快,而在这个过程中,互联网本身也在不断变化,这就好像汽车刚刚制造出来时,虽然能够提升出行效率,但昂贵的价格让汽车的受众面非常有限。而当汽车工厂实现流水线作业,极大降低汽车制造成本之后,汽车开始走向普罗大众。它代替了马车成为一种普通交通工具,同时在后续的发展中衍生了汽车修理维护、二手汽车买卖等行业。这就是技术应用和普世化发展的必经之路。

当互联网走入寻常百姓家后,我们开始有了新的思考和期待:互联网和计算机能否变得更加先进?能否帮助我们解决更多问题?在此背景之下,人们思考已久问题的答案开始浮出水面——人工智能。

人工智能觉醒

思考的过程,能否由机器参与?

人类对人工智能的探索并不是独立于对计算机和互联网的研究,相反,这三者的发展存在一个并行的过程,三者之间相互促进、相辅相成。

人工智能的萌芽可以追溯到20世纪40年代,心理学家沃伦·麦卡洛克和沃尔特·皮茨首次提出人工神经元模型的概念,代表神经元接收和处理信息的机制,他们的理论奠定了神经网络基础。

而最为人所知的是图灵于1950年发表的论文《计算机器与智能》( Computing Machinary and Intelligence ),对“机器能否思考”这个问题进行的阐述。文章对查尔斯·巴贝奇的差分机的理念进行了分析比较,认为巴贝奇的计算机理念属于机械式计算,而机器要代替人类必须要有电子计算机。图灵由此引入了电子计算机的概念,并将其分为三个部分:储存部分、执行单位和控制。在这篇论文中,图灵前瞻性地提出了“机器学习”(machines learning)的概念,这一理念在20世纪80年代得以延伸落地。

1956年美国科学家约翰·麦卡锡组织了达特茅斯会议,会议提出了“人工智能”的概念,至此AI正式走上历史舞台。此后AI技术发展进入了一个快车道,完全信息的对抗、机器定理证明和问题求解、模式识别、基于自然语言的人机对话等技术理念相继诞生。

世界上第一台具有一定对话能力的聊天机器人诞生于1966年,由麻省理工学院约瑟夫·维森鲍姆制作了一台名为“ELIZA”的机器人。ELIZA并不具备真正意义上的理解能力和分析能力,只是通过文本的拆解和重复,实现一定程度的“对话”,这和我们今天所谈的人机交互相距甚远。但对于人工智能的发展,这是一次重要的尝试,让人工智能以一种最直观、最具体的方式呈现出来,某种程度上也是图灵关于机器思考能力问题的延续,如果机器具备思考能力,那么它将如何体现出来呢?

20世纪60年代中叶,人工智能“专家系统”的概念被提出,它的核心方法论是模仿人类专家的知识和推理方式来进行决策。它包括两个部分——知识库和推理引擎,知识库是特定领域知识的合集,而推理引擎相当于它的思考模式。通过这种方式,能够对输入的内容进行分析、判断和解释。

80年代,人工智能的发展进入到了机器学习的阶段。美国计算机科学家汤姆·米歇尔在《机器学习》一书中对机器学习进行了定义:如果用变量P来衡量计算机程序在任务T当中的性能,该性能随着经验E的提升而增加,则称计算机程序从经验E中学习了任务T和衡量指标P,即学习过程Process<P,T,E>。这个时期,人们思考机器学习是什么以及它要做什么,这个过程可以划分为三个要素:模型、策略、算法。这三个要素对于人工智能整体都是至关重要的,模型是机器学习产出的函数,输入数据即得到结果,策略是学习的方式和最优选择的模型,算法是以历史数据为依托,寻找未知参数,形成最优解的模型。

经历了一段时间的发展后,人工智能从学术和技术角度逐步有了清晰的脉络,建立了相对清晰的技术和理论体系,包括深度学习、自然语言处理、计算机视觉、数据挖掘等。总体的思路就是让人工智能具备一些类人类的能力,比如视觉能力,人工智能能够“看见”物理世界中的场景,实现人脸识别、图像识别等功能;再如听觉能力和理解人类自然语言的能力、将输入的语音转化为文字的能力等。

20世纪90年代之后,人工智能发展的速度加快,同时一些实际应用场景也让人工智能进入了大众视野,使人们更加直观和深刻地感受到技术的进步。1997年IBM的机器人深蓝(Deep Blue)战胜了国际象棋冠军加里·卡斯帕罗夫。在深蓝的设计方案中,这是一个由两个2米高的立式机箱、500多个处理器和216个加速芯片组成的机器,能够预测对方棋手的基本走位和评估可能的结果,其能力可达每秒钟探索1亿种可能的棋位。虽然深蓝在赛后即退役,但这一事件第一次引发了普罗大众对人工智能的认知热潮。在后来的发展历程中,人工智能击败人类的戏份再次上演。比如,2016年谷歌的AlphaGo计算机程序在围棋比赛中击败了世界冠军李世石,2018年OpenAI的计算机程序OpenAI Five在Dota 2比赛中击败了人类顶尖玩家,并且平均天梯分数超过4200分。

2001年后的人工智能发展,呈现出全新的特点,这一时期互联网的快速发展带来了信息和数据量的指数级增长,从而为人工智能的快速发展提供了前所未有的良好条件。数据提供的信息就像植物生长所需的肥料,使其汲取养分后茁壮成长。那么,数据在人工智能的发展过程中扮演了什么样的角色呢?

当我们在谈论AIGC时,我们在说什么?

从认知层面来看,AIGC是一个更加整体和全面的概念,但从严格的学术意义来说,目前并没有统一的标准定义。目前国内学界的其中一种定义是,AIGC是一种以人工智能为技术手段的内容生产方式,区别于以往的专业生成内容(Professional Generated Content,PGC)和用户生成内容(User Generated Content,UGC)。中国信通院等发布的《人工智能生成内容(AIGC)白皮书》 ,对AIGC概念进行了三个层面的理解:一是以内容生产者角度来看,其主体是人工智能;二是以内容生产方式来看,其创作方式由技术手段生成;三是以技术角度来看,AIGC是能够产生内容的技术的集合。实际上AIGC不是一个单一维度的概念,它具有技术性、过程性和整体性。

总体来说,AIGC是一种技术集合,利用生成对抗网络GAN和大型预训练模型等人工智能技术,通过分析现有数据的规律,并具备适当的泛化能力,从而生成相关内容的技术集合。

从人工智能的发展和创新沿革的角度来看,AIGC代表着人工智能的新角色、新身份,甚至是未来新的发展方向。从传统的技术发展角度来说,人工智能原本的角色与其他新鲜的前沿技术一样,是能够帮助人类解决问题、提高效率、降低成本的工具,属于辅助性的技术;但AIGC的产生和应用,让人工智能具备了以往各项技术都不具备的新能力——创造力。这和图灵七十多年前的问题“机器会思考吗”本质上殊途同归,因为当人工智能具备创造能力后,它就不再仅仅是辅助性的技术,它很可能产生更高层次的思考能力甚至思维能力。因此,很多人开始担心职业的替代性,甚至未来是否会产生科技伦理问题,我们在后面会进行深入探讨。但这些担忧至少说明AIGC以及它所代表的人工智能体系,正在朝全新的业态和趋势迈进。

从目前的应用和落地的角度来看,AIGC在文本、图像和音视频生成、多模态生成、策略生成和游戏等相关细分领域已经有了一定的落地应用场景,也具备一定的产业价值,主要表现在:

降低创作门槛和成本 :AIGC的广泛使用能够进一步降低创作门槛和成本,声音录制、图像、文本、视频生成等AIGC工具的广泛使用,能够让创作流程更加简化、成本进一步降低。

提高内容生产的多样化 :目前的内容生成效果,取决于从业人员的专业能力和知识水平。AIGC的使用能够让更多非传媒专业人士成为创作者,能够将他们更多元化的知识体系引入到内容生产当中,从而产生更加丰富的内容。

提高用户交互体验 :目前在内容消费方面,用户对于个性化及可互动的内容需求仍在提升,AIGC的进一步普及能够生成更多可交互内容,甚至融合产生更多线上线下一体化的内容,可极大地提高用户体验、满足用户需求。

以AI绘图为例,2022年一幅名为《太空歌剧院》的AI绘图作品在美国科罗拉多博览会艺术比赛上获得了“数字艺术/数字修饰照片”赛道的一等奖。该作品是由一款名为Midjourney的AI绘图软件生成,作者介绍说自己是通过文字输入作画要求,包括题材、场景、光线、色彩等,通过AI生成了900多幅作品,在其中选取一幅并进一步修改,配合Photoshop润色调整而最终成稿。《太空歌剧院》的获奖引发了热议,很多人赞叹于技术的发达,也有不少人认为艺术的价值不能用冰冷的机器衡量。

img

图1.1 AI绘画作品《太空歌剧院》

图片来源:https://www.arts-in-the-city.com/2022/09/07/une-ia-secoue-lemonde-de-lart-en-remportant-un-concours/.

实际上,AI绘图是一个非常典型的AIGC实际案例。首先,它确实极大地降低了创作门槛。即使是毫无美术基础,也不会使用Photoshop或AI等相关软件的用户,也能够进行绘画创作,只需要用文字输入创意内容,并选择合适的风格加以调整,就能够生成插画,并且用户还具备自主选择的权利。其次,AI绘图能够实现即时生成,在输入后数秒即可完成绘画,极大地提高了作画效率,也降低了产出成本。

从技术的角度来说,AI绘图利用人工智能技术,将人类的自然语言的要求进行分析、拆解,以图像的形式输出,实现了人工智能真实的落地。在AI绘图应用刚刚问世的时候,不少人担心其绘画水平是否能够超越人类,但事实证明,在数据的不断“喂养”下,AI绘图已经具备了足够高的技术水平。从产业的角度来说,如果AI绘图技术能够达到相关行业要求,那么它可以在游戏、动漫、文创等领域进行大规模推广,帮助企业降低人力成本,提升产出内容的多元化水平。比如在游戏行业,目前来看,不涉及大规模动作或异常复杂的绘画已经可以交给AI绘图完成。

当然,仅就AI绘图这一具体应用而言,目前仍然存在一定的争议和疑问,主要包括:AI绘图的数据来源是否包括商用绘画作品,是否涉及知识产权问题?AI绘图的大规模应用是否为另一种形式的抄袭、模仿?它是真正带来了创意,还是另一种形式的模板?为此,我们将在后面的章节中详细探讨人工智能带来的管理问题和科技伦理问题,但是AI绘图的热议至少展示出人工智能具体应用的巨大潜力。

毫无疑问,随着未来技术的进一步优化,AIGC能够产出更多元化的内容,同时也会有更多新业态和模式出现。而当我们回顾AIGG一路走来的历程时,我们会发现,某种程度上AIGC代表着人工智能从弱人工智能向强人工智能发展的趋势,也代表未来技术的研发攻坚方向,就像互联网从PC端朝移动端发展一样,是人们需求的必然选择。

弱人工智能(Narrow AI)是以单一任务为核心的人工智能系统,它能够接收人类的指令,但只能完成单一任务。换句话说,它是模仿人类某部分的智慧来完成专项工作,而范围以外的事项它则无法完成。比如,AlphaGo能够在围棋上战胜人类,但它只会下围棋,做不了别的事情;一些自动回复的人工智能客服,可以根据关键词识别来安排实现设定好的回复,但无法处理更加复杂的客户需求;人工智能翻译,能够实现语言之间的转化,但更多的是基于文本字面意义的分析,而暂时无法实现文化层面的互通,这也是为什么专业类的文本翻译基本上已经非常准确了,但人工智能目前无法完全克服语义和文化层面上的转化问题。

强人工智能(General AI)则与人类的生物学智慧更加接近,它具备类似于人类的思维能力,能够进行更多元状况下的分析、判断、推理、思考和决策,并且能够自主学习。目前,从严格意义上来讲,并没有实际的强人工智能系统产生。2022年ChatGPT之所以能够引爆全球热点,除了技术本身的吸引力之外,人们也从ChatGPT身上看到了强人工智能的影子。ChatGPT和整个AIGC体系,实际上并非强人工智能,但它们代表了一种新的思考:人工智能从产出内容出发,未来是否能衍生出更强大的思考能力,甚至产生思维?当我们在谈论AIGC时,我们谈论的是人工智能的未来,甚至是人类科技体系的未来。

表1.1 强人工智能与弱人工智能的对比

img

从AIGC发展历程的原始逻辑来看,机器对信息的认知需要三个阶段。第一阶段是观察外部环境和寻找规律的阶段。这个阶段,AI只能被动接收数据,其能力仅限于对已有的统计数据和结果进行分析,因此无法超越现有经验,更无法创造新的内容。第二阶段是干预外界环境的阶段,AI能够在一定程度上实现数据的创造,从而超越已有的经验,原理类似于将用户生成内容(UGC)的方法应用于内容规则制定,进而用于人工智能的内容生成。第三阶段的人工智能将具备反事实分析来寻找规律的能力,真正实现内容的自有创作。

从AIGC发展历程的时间节点来看,红杉资本的报告 Generative AI A Creative New World 对AIGC的技术进行了阶段性的解析。第一阶段是2015年之前,以小模型作为绝对的技术核心,这些小模型在分析性任务方面表现出色,也被用于工作量预测或者欺诈分类等应用场景,但是其智能化水平远远没有达到帮助人们写代码的程度。第二阶段是2015—2021年,Google Research团队发布了一篇极具历史意义的论文 Attention is All You Need ,提出了Transformer的架构逻辑。作为以自然语言理解为核心的神经网络架构,Transformer可以生成更高质量的语言模型,同时训练时间明显减少。随着训练量的增大,其水平也逐步提升。第三阶段是2022年之后,红杉资本认为此后的训练成本将进一步降低,而人工智能的研究团队也将着眼于更大模型的开发。第四阶段是在技术逐步成熟后,随着平台层基础的夯实,模型的成本降低、训练效率提升,以此为基础的应用将爆发式涌现。

尽管对于AIGC的未来,目前的研究和预测都不能看成标准答案,我们仍然需要在不断实践中看待技术更新的实际情况。但是我们可以从现有的实际应用出发,客观分析和观察人工智能的整体发展方向,其中最典型的例子,就是现在人人都在谈论的ChatGPT,我们在第二章中将详细探讨。 hHX25/hrAB4kNjK5PswAvvy+fy0q+WrOIMWnErU9aPJmA2MZE8Sn6xp1dtyuUoyo

点击中间区域
呼出菜单
上一章
目录
下一章
×