众声喧哗和异口同声,在科技界往往存在于同一件事情,这样的事让不同的人说着相同的话。原创性思想往往会出乎意料地在同一时间出现在多个地方。
就在红杉资本发表《生成式人工智能:创意新世界》的一个多月后,两家科技大公司展开了全面的行动。
2022年11月3日至5日,阿里云栖大会在杭州的云栖小镇召开。在当天下午的技术主论坛演讲中,时任阿里巴巴达摩院副院长的周靖人做了一个题为《模型即服务,助力AI新发展》的演讲。
他首先提出了一个问题:过去十年,人工智能的技术和模型都得到了快速发展,但人工智能的应用仍然面临一系列的挑战,这主要是由以下几个因素造成的。
第一,模型的开发仍然具有一定门槛,因此今天的模型开发往往是由大公司或专业的科研机构来推动的。第二,模型的定制化需求仍然存在。第三,使用模型的方法千变万化,且没有统一的接口等,这也导致今天使用模型需要大量的专业知识和技术配置。第四,缺少一个统一的模型分享平台,难以帮助遇到困难的开发者快速找到相应的模型并下载应用。
周靖人还指出:阿里云提出了一个全新的概念——模型即服务,并指出“模型即服务”将解决上述一系列的技术问题。
所谓“模型即服务”是指:把模型视作生产的一个重要元素,围绕模型的整个开发周期——从模型的产生、管理、下载、应用到最后的部署——提供服务。换句话说,阿里巴巴打算为开发者提供零门槛的模型体验。
这也意味着:首先,阿里需要建立起一个中心化的仓库来管理各种模型。同时,模型离不开数据和算力,阿里需要有相应数据集去配合模型的使用,还要结合阿里云有效的GPU(图形处理器)和CPU的算力平台。
阿里巴巴宣布,为了使“模型即服务”这一新概念落地,一个由阿里达摩院和CCF(中国计算机学会)开源发展委员会共同发起的开源社区已经准备就绪,该社区名叫Model Scope(魔搭社区),周靖人代表阿里达摩院希望这个社区能够承载各式各样的模型,成为一个模型的万花筒,促进人工智能应用的广泛发展。
在这次云栖大会上,阿里达摩院系统AI实验室时任负责人贾扬清现场演示了阿里的协同办公应用钉钉在接入大模型之后的功能,包括可以实时对话作诗、实时对话画图等。
实时对话作诗的功能就像ChatGPT,实时对话画图的功能就像Midjourney。贾扬清的这一系列演示表明,钉钉上很早就出现了类似于ChatGPT形式的能力。根据阿里内部人士的说法,其实在云栖大会召开前的2022年10月,阿里内部办公的钉钉群内,就已经有人在用AI机器人对话。
不过在当时,绝大部分人都没有意识到,上述这些内容即将引领一个新时代,并且这个新时代很快就将向世界展现出它的魔力。
另外一边,微软公司则行动得更早。
2019年7月22日,微软官网悄悄挂出了一则新闻,称OpenAI已经与微软公司建立独家的计算合作伙伴关系,两者将共同打造全新的Azure AI超级计算技术。
这则新闻的副标题是:“拥有值得信赖与授权的多年合作伙伴关系、共同的价值观,以及由微软投资的10亿美元,OpenAI将专注于建立一个平台并将利用该平台创造新的人工智能技术,兑现通用人工智能的承诺。”
需要注意的是,微软在官网上将OpenAI与自己联系在一起有一个重要的历史背景。
实际上,OpenAI在早期发展中还面临着一个重要挑战,那就是:由于人工智能的研究和开发成本很高,OpenAI需要很多钱。此外,顶级人才通常都要股票期权,如果OpenAI一直是一家非营利公司,它将如何从谷歌、脸书等科技巨头手中抢夺人工智能的人才呢?
2019年,OpenAI宣布重组,以作为对上述问题的一种解决方案,并创建了一个营利性的子公司,母公司则仍然为非营利组织,然后,开始采用“盈利上限”的模式。
所谓“盈利上限”是指:OpenAI将把早期投资者的回报限制在其原始资本的100倍,以防止投资者驱动公司只关注利润。而且,后面投资者的回报上限只会更低。
“我们在这个问题上进行了非常艰苦的斗争。”后来奥尔特曼告诉媒体,“因为我们知道,如果你真的制作了AGI,基本上就像按下了一个按钮,然后说出你希望公司能够赚多少钱。”
需要注意的是:根据OpenAI对AGI的定义,AGI是指“在最具经济价值的任务中超越人类的自主系统”。
而几乎就在OpenAI定下“盈利上限”模式的同时,2019年3月,奥尔特曼宣布卸任YC总裁,正式出任OpenAI的首席执行官。同年7月,OpenAI接受了微软公司10亿美元的投资。
事后看起来,微软与OpenAI的结盟,可能是美国科技公司内部最为热烈的浪漫史之一。OpenAI的首席执行官奥尔特曼也在这个时候展现出了他作为一名精明的交易撮合者的特质。
通常,一个人区别于另外一个人的特质在他的少年时代就会表现出来。奥尔特曼也如此。他在还是一名大学生时,就创立了一个移动社交网站Loopt。尽管这个项目后来失败了,但奥尔特曼成功地说服了美国的无线运营商帮他去分销这个项目。2018年,OpenAI的技术开始进步,其团队开发出了GPT的第一个版本。奥尔特曼需要有更多资源来跟上。他首先向两位密友求助,希望OpenAI能够获得数千万美元的投资。
奥尔特曼的这两位密友,也是大名鼎鼎的人物:一位是投资者兼企业家里德·霍夫曼,他创立了美国职业社交网站的天花板领英;另外一位则是硅谷早期IT及互联网技术服务公司Sun的联合创始人、硅谷顶级的技术风险投资家维诺德·科斯拉。
经过反反复复的讨论,当霍夫曼与科斯拉确定确实可以从OpenAI这样一个长期且雄心勃勃的想法中赚钱后,科斯拉的硅谷顶级技术风险投资机构Khosla Ventures(科斯拉风险投资公司)向OpenAI开出了支票。
奥尔特曼则同意创建一个OpenAI的营利性部门,这个部门负责产生回报。奥尔特曼自己不持有任何新组建公司的股权,这可能也反映了OpenAI新公司创立时的章程设置:只有少数董事会成员可以同时持有营利性实体的财务股权,并且只有没有财务股权的董事会成员才能够对财务利益相关者与非营利组织的使命之间存在的潜在冲突进行投票。
之后,奥尔特曼就把目光转向了微软和它的首席执行官萨提亚·纳德拉。
奥尔特曼转向微软的原因有两个。第一个原因是,多年来微软一直在对人工智能进行代价高昂的押注。微软认为,这是提高公司生产力并在竞争中获得优势的一种方式。
事实上,当时微软的研究人员正在训练一个大规模的人工智能模型,旨在解析从互联网上抓取的数百万份文档,这一人工智能模型被称为“图灵”。微软后来称这一战略为“大规模人工智能”,核心理念是要找到“图灵”的赢利模式,因为它的开发成本实在太高昂——训练模型所需要的计算能力,远远超过了微软系统的计算能力。而根据美媒引用的知情人士的说法,纳德拉已经指示微软各团队使用“图灵”等人工智能模型来优化他们的产品。
第二个原因是为实现从“图灵”中赚钱这一目标,微软的首席技术官凯文·斯科特与全球芯片制造商英伟达达成协议,由后者负责开发高性能图形处理单元(人工智能从业者首选的芯片类型)以及能够处理训练人工智能所需要的繁重工作的电缆。微软自己则开发了名为DeepSpeed的新软件来提供帮助。
这些使微软公司成为OpenAI颇具吸引力的合作伙伴。由于OpenAI的模型严重依赖昂贵的云计算,奥尔特曼开始积极地向微软示好,多次飞往微软位于华盛顿州雷德蒙德的总部以达成交易。
当然,对于微软掌门人纳德拉来说,他还有另外一重考虑。
2014年,纳德拉成为微软的第三任首席执行官。此前,他是微软云和企业集团的执行副总裁,负责构建和运行微软的云计算平台。纳德拉曾领导了微软的一些重大项目,包括将微软转向云计算,以及开发出世界上最大的云基础设施之一。显然,云计算出身的纳德拉还看到了推动微软云业务的绝佳机会。
他知道,他的遗产将通过微软公司向客户租赁服务器与算力的能力来衡量。在云计算方面,亚马逊的AWS(亚马逊网络服务)已经赢得胜利,是美国三大云服务商的老大。排名第三的谷歌则正在试图追赶,而微软夹在中间,纳德拉需要一种快速发展这项业务的方法。
纳德拉对奥尔特曼的想法感到很兴奋。作为一名1992年就加入微软的老兵,他曾目睹了微软在早期的许多优势中失利,特别是在智能手机和平板电脑市场。微软的移动操作系统曾先于苹果推出,但之后被苹果公司超越。随后,微软收购了手机制造商诺基亚,但仍然没有取得显著成果,并且微软在搜索和广告领域追赶谷歌的大部分努力也都收效甚微。2014年,在新首席执行官纳德拉的带领下,微软的股价开始攀升:微软先是创造了云计算的奇迹,现在纳德拉计划带领微软在未来几年通过人工智能来创造利润。
2019年7月,微软宣布向OpenAI投资10亿美元。其中大部分钱,以微软云平台Azure的积分体现。这基本上可以使OpenAI免费运行在微软云上。其结果之一是,与微软竞争的谷歌云迅速失去了它最大的客户之一OpenAI,因为OpenAI宣布将在微软Azure上独家运行。
这也正是2019年7月微软官网悄悄挂出微软将与OpenAI共同打造全新的AzureAI超级计算技术的由来。
到了2021年,纳德拉正式对外宣布了这项新服务——Azure OpenAI,开始允许微软客户通过微软云平台Azure来安全、合规地访问OpenAI的API(应用程序编程接口),以使用OpenAI的各种模型,包括GPT-3。
而到了2022年,访问权限进一步拓展到了DALL·E2,以及OpenAI一种基于GPT-3、能够在开发人员输入时自动生成计算机代码的工具。当然,还包括OpenAI在2023年推出的GPT-4。