2022年8月24日,美国西雅图华盛顿湖畔,OpenAI的两位创始人萨姆·奥尔特曼和格雷格·布罗克曼(Greg Brockman),以及年轻的研究员切尔西·沃斯(Chelsea Voss),心怀忐忑地敲开了比尔·盖茨造价1亿多美元豪宅的大门。
虽然早已退出微软的董事会,但作为创始人的比尔·盖茨与公司高管依然保持着密切联系,他对人工智能的看法,也会在一定程度上影响微软的投资决策。5个月之前,盖茨在自家豪宅里举行的一次晚餐中对奥尔特曼和布罗克曼说,他对OpenAI研发的大语言模型的有效性表示怀疑,这让两位创始人的内心受到了一些打击。
时隔5个月,三位年轻人准备向盖茨展示他们研发的最新技术时,盖茨把微软的几位高管也叫来了。他们在宽敞的客厅里坐着,而在一个巨大的数字显示屏上,研究员沃斯向在场人员展示了一项名为GPT-4的技术。
GPT-4现场演示了它参加一项高级生物学多项选择测试的结果,总共有60个问题,GPT-4竟然只错了一个。据《纽约时报》的报道,这让盖茨极为震惊。他的反应并非过度,仅仅3个月之后,OpenAI上线了让整个世界都为之震撼的实时对话和交互应用——ChatGPT。
ChatGPT的诞生注定会在人工智能漫长的发展史中作为里程碑式的事件而被反复提及。它不仅让人工智能成功跨越了拐点,揭示了人工智能的巨大潜力和广阔市场,同时也吹响了全球科技企业开展大模型“军备竞赛”的号角,预示着一个崭新的人工智能时代的到来。
2023年,在中国人工智能领域中,“百模大战”绝对是一个绕不开的话题。对于大模型平时关注不多的读者可能会认为,是ChatGPT在全球的爆火,才让中国科技企业迅速加入这场战局。
这只说对了一半。一些初创人工智能企业的确是眼见ChatGPT引发的狂潮到来,迅速融资后开始投入大模型的研发。但国内一些互联网大厂在人工智能领域深耕已久,早就进行了多年的细致布局与准备。
阿里云从2009年开始自研大数据计算服务ODPS(Open Data Processing Service),因此在大规模数据处理和大规模算力应用上,建设了领先的技术能力,由此推动了人工智能平台PAI在2014年的诞生。
在大模型的研发上,阿里云从2018年就开始跟进,当时还是以预训练模型为主。进入2022年,阿里云认识到生成式AI可能是未来的主流,便从当年3月正式开始布局整个“以生成式任务为核心”的研究线。
半年之后,2022年9月2日,阿里云首次发布通义大模型系列,包括通义M6、通义AliceMind等多种通用模型。两个月后,阿里云在2022年云栖大会上率先在业界提出“模型即服务”理念,即MaaS(model as a service),打响了降低AI开发门槛的“第一枪”。
2023年4月,通义千问大模型在阿里云峰会上揭晓。阿里云首席技术官周靖人介绍,通义千问能够实现多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等服务,并通过API(应用程序接口)插件实现AI能力的泛化。
此后,通义千问大模型不断优化。10月31日,阿里云正式发布通义千问2.0版本,参数量已经达到千亿级。在MMLU、AGIEval、C-Eval等10个主流基准测试集上,通义千问2.0的综合性能超过GPT-3.5,加速追赶GPT-4。
2017年7月,百度开启“All in AI”(全部押注人工智能)战略后,其在人工智能领域的研发力度也明显加大。2023年3月16日,百度官宣新一代大语言模型文心一言启动邀请测试。虽然文心一言最初由于反应慢和答非所问等问题受到用户的诟病,但在2023年10月发布4.0版本之后,随着其基础模型的全面升级,它在理解、生成、逻辑和记忆能力上都有了显著提升。
2023年9月7日,在一年一度的全球数字生态大会上,腾讯的混元大模型正式对外亮相。该产品由腾讯全链路自研,拥有超千亿参数规模,预训练语料超2万亿token。腾讯混元大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向。
大模型吸引了千行百业的翘楚进入,除了上述三家大厂,华为、京东、字节跳动、美团、科大讯飞等科技互联网大厂也都加紧入局。此外,移动、联通、电信三大运营商,清华、复旦、哈工大等高校和科研院所,还有达观数据、百川智能、第四范式、出门问问等人工智能创新公司,都在2023年发布了各自的大模型。
2023年1—7月就有共计64个大模型发布,国内大模型呈爆发式增长态势。根据赛迪顾问发布的《2023大模型现状调查报告》,截至2023年7月底,中国累计已有130个大模型问世,“百模大战”局面已然呈现。到10月,国内公开的大模型数量累计达到238个,大模型的竞争开始进入“大力出奇迹”的阶段。
国内“百模大战”如火如荼之时,其他国家的科技公司难道只是隔岸观火吗?当然不是。如果我们将视野放至全球,就会发现各国对大模型应用与开发的重视程度高度一致,但从取得的成绩来看,可以说中美两国是毋庸置疑的大模型技术引领者。
钛媒体国际智库发布的《2023 AI大模型应用中美比较研究》报告认为,美国的优势是以谷歌为代表的科技巨头长期投身于人工智能基础理论的研究,使得美国引领着人工智能的发展潮流,依托浓厚的工程师文化,美国在基础大模型上保持领先优势。
在一级市场上,以英伟达、微软、赛富时等为代表的科技巨头成为美国人工智能领域最重要的“独角兽猎手”,它们的大手笔投入为美国人工智能的发展积蓄了力量。
根据2023年11月29日发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》,美国和中国发布的通用大模型总数占全球发布量的80%。但除了中美两国,如欧盟成员国、英国、加拿大、新加坡等其他国家和地区,仍处于大模型前期尝试阶段,只有个别头部企业开始应用。
与大多数对大模型尚处于观望阶段的国外科技企业相比,为什么中国企业加入大模型竞赛的热情如此高涨,推进的速度又如此之快?答案很简单——要在市场上率先“卡位”。大模型研发企业都有一个愿景:自己的大模型发布得越快,企业便越能抢先获得更多用户数据,从而再投喂给自己更好的大模型,以此实现“数据飞轮效应”。
英伟达创始人兼CEO黄仁勋说过一句话,“我们正处在AI的‘iPhone时刻’”,预示着一个难以估量的AI巨大市场正摆在所有科技企业的面前。根据国际数据公司(IDC)预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。
大模型对于人工智能发展的基础性作用已经成为公认的事实,任何怀揣远大理想且具有研发能力的科技企业,都想将大模型研发的主动权握在自己手里。但与之相对应的一种说法也很快出现:大模型本身并不会直接产生价值,基于基础大模型开发出来的应用才是模型存在的意义。
这种说法也不无道理。无论怎么“卷”大模型的研发,最终还是要回归到商业的本质上来,公司不能一味烧钱,必须向盈利的目标迈进。2023年,基于国内130个大模型而推出的应用产品中,只有阿里巴巴大文娱团队推出的妙鸭相机成功破圈,成为一款公认的现象级AIGC产品。至于类似ChatGPT、Midjourney这样具有世界性影响力的应用,相信也是中国AI业界的共同目标。
为了规范和营造更利于大模型发展的环境,在2023年8月15日《生成式人工智能服务管理办法》开始实施前,国家相关政策要求未向国家网信部门申报安全评估,并做算法备案的生成式AI产品不得向大众开放。从8月31日开始,百度文心一言、阿里云通义千问、百川智能、商汤商量(SenseChat)、腾讯混元大模型等产品通过备案后,已经陆续向公众开放。
“百模大战”瞬时进入激烈的“肉搏战”,各家企业的大模型中,究竟谁的使用体验好,谁的商业落地能力强,已经到了“是骡子是马,拉出来遛遛”的阶段。
在“百模大战”进入下半场时,我们都知道,大模型的三大关键因素是算力、算法和数据,但其实对于大模型来说,需要更为关注的就是场景应用。
在2023年阿里云峰会上,时任阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇,提出了另一种将大模型介入应用的视角:面向AI时代,所有产品都值得用大模型重新升级。阿里巴巴也带头示范,钉钉、天猫精灵等产品已经接入了通义千问进行测试,成为国内第一批“尝鲜”大模型的产品或应用。
这充分体现出互联网大厂们的优势,它们本身的业务场景足够丰富和多样,哪怕没有外部客户,大模型产品在自己的业务上也有足够多的场景进行验证和优化。
2023年9月,新任阿里巴巴CEO、阿里云智能集团CEO吴泳铭更是通过一封全员信,展现了阿里巴巴全面拥抱AI的决心:“阿里确立两大战略重心:用户为先、AI驱动下一个十年。……我们各业务有大量用户场景,我们必须让这些场景都变成AI技术最佳的应用场景,通过技术创新带来突破性用户体验和商业模式。”
在AI时代,计算模式正面临变迁,所以对于云计算厂商来说,AI也带来了算力需求的爆发性增长。基于AI,新的软件架构、软件方法和计算架构,在未来很长一段时间内都会处于颠覆和重新洗牌的过程。未来云计算支持的所有行业的应用构建,以及背后的算力存储调度,大概率都会由各个垂直行业的AI模型作为底层系统来驱动。
下一个十年,最大的变量毫无疑问是AI带来的全行业深刻变革。
我们理解互联网大厂大力推动大模型发展的逻辑,其实还有一个维度:大厂普遍连接着产业,有庞大的下游应用市场,研发出大模型产品后能迅速应用到产业中。
因此,在“百模大战”的下半场,在人工智能领域纵横多年的互联网大厂们已经开始构建大模型生态系统:在C端(消费者端),大厂面向创作者和开发者提供服务;在B端(企业端),则以提供解决方案为主,尤其偏重金融、文旅、传媒、医疗、政务等行业,同时也为其余大模型研发企业提供算力、数据管理等基础设施服务。
以阿里云为例,它的大模型生态提供了四个方向的产品与服务:第一层即最底层,是依托阿里云全球基础设施搭建的PAI-灵骏智能算力平台,以及数据管理服务系统;第二层是通义千问和通义万相两个基础模型,以及在它们基础之上开发的八个行业模型和应用;第三层是阿里云百炼一站式大模型服务平台(下文简称百炼);第四层是人工智能开放社区魔搭。
阿里云首席技术官周靖人做过一个总结:“服务好AI大模型时代的创业者、开发者及企业客户等,阿里云正在努力成为AI大模型时代的基础设施。”
而更多中小企业意识到与大厂存在从资源、人才到资金的系统性差距,开始从细分市场寻找生机。比如商汤科技、出门问问、第四范式等企业,开始专注于将大模型能力迁移到其既往的优势业务领域中。
如今,“百模大战”已经进入比拼生态系统建设的深水区,可以说激战正酣。这也在客观上让中国人工智能领域呈现一片繁荣之势,但业内的共识是,开发出大模型只是万里长征第一步,让大模型实现商业化落地,真正让大模型融于我们的日常生活中,才是研发大模型的应有之义。
1994年,《连线》杂志创始主编凯文·凯利在他的《失控》一书中,对人工智能技术有着极为精准的预测:
“我们几乎不会注意到水果上的标签、电影字幕等无处不在的文字。马达刚开始出现的时候就像一只巨大高傲的野兽,但自那以后,它们逐渐缩小成为微事物,融入(并被遗忘于)大多数机械装置之中。
“最深刻的技术是那些看不见的技术,它们将自己编织进日常生活的细枝末节之中,直到成为生活的一部分。”
现在,人工智能技术正朝着“成为我们生活的一部分”的方向汹涌奔去。而在人工智能的浪潮之下,中国几乎每个细分领域都有大量创业者在思索如何做出生成式AI创新型应用。我们会在本章后续的小节中介绍这些创新企业的探索案例。