人工智能是一种用于计算机模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。
“人工智能”一词最初是在1956年达特茅斯会议上由美国计算机科学家约翰·麦卡锡(John McCarthy)首先提出的,麦卡锡因此也被称为“人工智能之父”。该会议确定了人工智能的目标是“实现能够像人类一样利用知识去解决问题的机器”。它的初衷是希望能让机器像人类一样,代替人类完成一些任务。
人工智能是一门以机器模拟人的智能行为的学科,其目标是通过模仿、延伸和扩展人的智能。随着研究范围的不断扩大,人工智能已经从狭义的理论扩展到广义的工程技术领域。
从历史上看,人工智能经历了一个从萌芽到低谷再到繁荣的过程。20世纪50年代人工智能概念诞生后,许多科学家开始参与其中,并研究如何让计算机模拟人类智能,图1-1展示了人工智能的发展历程。
图1-1 人工智能的发展历程
(资料来源:中科院自动化研究所)
20世纪60年代,研究人员开发出了基于“逻辑推理”的人工智能系统,这些系统可以在一定程度上模拟人类的思维过程,并诞生了首台人工智能机器人Shakey。也是在这一时期,美国麻省理工学院的魏泽鲍姆(Weizenbaum)发布了世界上第一个聊天机器人Eliza。
20世纪70年代初,人工智能的发展进入了一个比较低迷的时期。当时计算机的内存有限且处理速度较慢不足以解决任何实际的人工智能问题。由于缺乏成果和进展,对人工智能提供资助的机构(如英国政府、美国国防部高级研究计划局、美国国家科学委员会等)对无方向的人工智能研究逐渐停止了资助。
20世纪90年代,人工智能才又开始了自己的黄金时代。这主要得益于两个方面:一是计算能力的提升,使得人工智能系统能够处理更大量的数据;二是机器学习的发展,使得人工智能系统能够根据实际情况自动学习和改进。这些进步使得人工智能在诸如图像识别、语音识别、机器翻译等领域都取得了显著的成果。
人工智能研究的目的是为了促使智能机器会听、会看、会说、会思考、会学习、会行动(有人总结为“六会”),涉及语音识别、机器翻译、图像识别、文字识别、语音合成、人机对话、人机对弈、定理证明、机器学习、知识表示、机器人、自动驾驶汽车等多个科学领域(表1-1)。
表1-1 人工智能类型一览表
在当今的人工智能领域,深度学习是一种重要的技术。它使用了一种被称为神经网络的模型,神经网络可以模拟人脑的运作方式来处理数据。目前,深度学习在许多不同的领域中都有广泛应用,如自然语言处理、图像处理、游戏和机器人控制等。
它的基本工作原理是,通过预定义的算法,将大量的输入信息映射到大量的输出信息上。首先,计算机会从大量的输入数据中提取特征,然后根据这些特征聚类,形成一系列联系分类,从而形成数据模型。其次,通过调整模型的参数,使得数据模型尽可能接近训练样本数据,这个过程就称为“训练”,可能需要大量的时间和算力。最后,当训练完成后,深度学习算法就可以有效地把输入映射到输出,也就是说,它能够识别输入并对其进行适当的反应。
因此,深度学习是一种非常有效的机器学习技术,可以实现自动化的数据处理,从而让计算机更加“智能”,以更加准确、迅速的方式处理复杂的任务。
当然,人工智能的发展也带来了一些前所未有的问题。例如,人工智能系统的决策通常是不透明的,这意味着人们很难理解它们为什么会做出特定的决策。这可能会导致决策的不公平和不可预测。此外,人们也很担心人工智能技术的发展可能导致一些就业机会的流失。更有激进者担心人工智能未来可能统治人类。因此,人工智能的发展必须与道德和伦理相结合,符合人类的社会背景和需求,以确保它能够为人类带来真正的好处。
图灵测试是一种评价人工智能的测试方法,它的名字来源于英国数学家艾伦·图灵(Alan Turing)。图灵测试是指以人类测试官与被测试的机器或软件之间的对话(通过聊天或文本)。该测试官根据对话的内容,评估此机器或软件是否能够像人类一样思考。
图灵测试可以用来作为人工智能系统的测试集,即从技术角度考察人工智能系统是否达到真正令人满意的人工智能水平。
OpenAI的自然语言模型GPT-4(Generative Pretrained Transformer 4)被认为是具有前所未有的自然语言处理能力的初步技术,目前它被普遍地认为是最有可能通过图灵测试的。GPT-4表现出色的一个主要原因就是它的独立性。由于它不需要依赖任何人工智能模型,而且它不仅能在给定示例中模仿正确的输出,还能在没有给定示例的情况下自己思考出正确答案,这让它显得更加智能。GPT-4并非完美,但它代表了当今时代人工智能发展的一个里程碑。
人工智能从基础概念到深度学习、扩散模型和即将开始图灵测试只用了短短几十年的时间。这样的指数级增长让人工智能不断地推动现代科技的发展,涌现出无数前所未有的技术创新。随着人工智能技术的不断提高,它必将渗透到社会的各个领域,为我们的生活带来巨大改变,同时也将创造无限商机。
在我国,在5G时代的技术研发中,人工智能技术、大数据处理能力和云计算能力被认为是三大关键能力。这三项技术的发展将为我国的信息化建设和经济发展带来巨大的潜力和机会。
随着互联网的高速发展,全球互联网用户的数量正在以惊人的速度增长。根据最新的统计数据,截至2022年,全球互联网用户人数突破50亿,占全球人口63%,尤其在我国,更是达到了惊人的10.32亿,位居全球第一位。这一数字还在快速增长。
未来,互联网将会更加依赖于大量的数据来支持其日益增长的应用和服务。尤其是自媒体行业、短视频行业的兴起,在丰富网民娱乐的前提下,对数据量的需求也将进一步加大。同时,在新兴领域,如智能家居、自动驾驶以及智能医疗等行业都需要大量的数据来进行分析和决策。这些技术很大程度上取决于能够收集到的数据的质量和数量。
以往的互联网内容数据贡献方式主要由UGC(用户产生内容)、PGC(专业生产内容)的方式构成。
然而,随着高质量内容需求的不断增大,这些传统的方式显然已经无法支撑未来的网络数据需求,因此AIGC的概念应运而生。
AIGC最早于2021年7月出现在中国互联网,指的是通过人工智能自动生成内容,如图片、文字或视频。彼时还没有多少人关注这个正在勃发的新兴领域,因为那时候的AI还没有诞生出一个足够惊艳的应用,一切还都停留在概念阶段。
然而,短短一年的时间,AIGC领域发生了翻天覆地的变化,Stable Diffusion的开源、ChatGPT的惊艳表现、无数AI新应用的火爆出圈,彻底点燃了AIGC概念的蓬勃发展。根据Wind数据显示,2022年11月,AIGC开始作为投资者问答关键词现身,且热度逐步攀升。绝大部分投资者的提问聚焦于上市公司的业务是否与AIGC相关。
技术的发展使AIGC这种人工智能生成内容的方式成为主流奠定了基础。AIGC的生产效率、质量都要比PGC及UGC的方式更有优势。尤其是资本市场的发热,更会加速AIGC生态的发展与完善,有望在多条产业带上逐步落地。
在百度创始人李彦宏的判断中,AIGC将会迎来三个发展阶段:第一阶段是助手阶段,AIGC辅助人类进行内容生产;第二阶段是协作阶段,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是原创阶段,AIGC将会独立完成内容创作。
而现在的AIGC已经开始了第一阶段的发展,我们作为AIGC的先锋探索者,需要在这一阶段把握时代的先机,在AIGC探索的道路上不断前行,并在高质量推进中国式现代化的发展背景下,争取利用AIGC的关键技术结合各个现代化领域并落实到实际应用中来。