购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

本刊特稿 | FEATURE

深度求索的新年礼物

人类只能重新回到创造这条路上,将人工智能当作拐杖,拄着这根用人类智慧之光做成的拐杖,就是拄着人类的过去,去创造未来。

文/赵德钦

不出意外的话,“深度求索”是国外媒体普遍熟悉的名字,在中国,它最被周知的名字是“DeepSeek”。

过去两三年,人工智能领域群雄并起,但唯ChatGPT马首是瞻。中国农历乙巳蛇年新年前后,1985 年出生的深度求索创始人梁文锋参加了总理座谈会,关于他和“幻方量化”的新闻报道就开始像鞭炮一样,条条炸响。响声撼动了大洋对岸,美国新任总统特朗普让美国人工智能企业好好反思;“人工智能兵工厂”英伟达创始人黄仁勋一边赞叹深度求索的成就,一边强调高端显卡仍然威力无穷,还一边不得不面对自家股票急刹车。人工智能巨头OpenAI创始人站出来谈深度求索的“抄袭”问题,说它使用了ChatGPT的数据训练,却同时耐人寻味地表示,对这个异军突起的劲敌“不会采取法律诉讼行动”。

故事有点婉转,精彩部分如连绵的烟花般绚烂:深度求索实现了在中国境内合理合法使用顶级人工智能的平权。春节长假中,一系列围绕它的知识付费产品,使用教程,一批模仿并追赶它的同行,以及一波追着给它递送“弹药”的投资人,上演了一部部“人工智能版”的贺新年大剧。

这是深度求索送给中国创业者的新年礼物。

千疮百孔的“小院高墙”

说深度求索是美国“送”给中国的礼物,也不为过。

ChatGPT自发布以来,芯片、人工智能技术等高科技行业或产业,就被美国列为不对中国开放和贸易的领域。不仅禁止相关投资,更禁止相关芯片产品贸易、技术交流和产品的使用,建立了以美国及其核心盟友为中心的科技版的“小院高墙”。

中国是为数不多不能合理使用ChatGPT等有美国元素的人工智能产品的国家或地区之一。为此,他们从注册、使用等方面设立了许多壁垒。

刘磊是中国人工智能创业者之一。ChatGPT还没发布,他就以开发者的身份,目睹和体验了这类通用人工智能给人类带来的震撼。ChatGPT一上市,他就计划组织团队,打造自己的人工智能产品。

事情却没有像他预想得那么简单。ChatGPT并不对中国内地及中国香港地区开放使用。如果要绕开这一限制,首先要用网络代理软件更改网络IP,然后用美国或者其他被许可国家或地区的手机注册。同时,相关API和会员服务,还必须使用美国或者其他被许可国家或地区的信用卡支付。

一切软硬件准备好后,还要面临网络代理带来的网速不稳定,问答不流畅等问题。个人使用都成了问题,更不用说要对其进行二次开发。除非投入海量资金改善网络、使用和服务环境。

以网络代理为例,普通个人使用的网络代理,价格多在每月十几元到几百元不等,每月从 1G到十几G流量不等。他们通过在国外建立服务器,以不合法的方式在中国提供网络代理服务。如果要升格到企业级代理,费用和难度就会指数级上升。

不过,ChatGPT建立起来的所谓高墙,就在这些蚂蚁搬家式的小生意中,变得千疮百孔。

一边是被高墙围起来的一棵参天大树,一边是墙外草地、灌木、森林交错的竞争生态。中国人工智能产业赢得了难得的喘息、修炼机会。Kimi、文心一言、豆包、通义千问、深度求索等,中国本土大语言模型纷纷涌现,并在不同的训练和优化路径中,各自形成了自己的特色和优势。

从人类最初只使用弓箭、长矛等冷兵器,到学会驯服马匹,再到大航海时代、电力革命、载人登月、互联网发明,每一项伟大发明背后都有一系列围绕发明的创新。LED替代钨丝点燃灯泡,不锈钢取代碳纤维放飞火箭,5G扯掉网线让信号腾飞,把发明和创新交还市场,才会在市场中看到更多发明和创新。

围追堵截中,中国的人工智能从造轮子加速到了造未来的阶段。

商业非主流的主流叙事

农历除夕前一天( 2025 年 1 月 27 日 ),深度求索应用同时登顶苹果中国地区和美国地区应用商店免费App下载排行榜,超过了ChatGPT。同日,英伟达股价历史性重挫 17%,市值蒸发近 6 000 亿美元,写下美国股市史上一家公司的最高单日跌幅纪录,欧美科技股也连带大跌。

至今,这股冲击波仍在回荡。人们原本以为,开发领先的人工智能需要使用大量昂贵的芯片,结果深度求索颠覆了这个预设,无异于在人工智能领域为中国绕弯开出了一条新路。

梁文锋曾说,他转换跑道的决定完全出于对科学的好奇,而不是盈利。他说,即使问他,他也找不到创建深度求索的商业理由。因为从商业的角度,这不值得做,基础科学研究的投资回报率很低。

就是这股“想做”的冲劲,今天的深度求索不仅能脱颖而出,而且还是中国唯一一家不依赖百度、阿里或字节等科技巨头融资的领先人工智能公司之一。

其实深度求索放在全球都是非常另类的人工智能初创公司。梁文锋 2015 年成立了一家对冲基金,成为首只募集资金超过 1 000 亿元的量化对冲基金。深度求索只是这只基金深度学习研究的分支之一,名为Fire-Flyer。

多年来,Fire-Flyer一直被用来处理财务数据。与其他大厂动不动 10 万、几十万最高端英伟达显卡相比,只有区区10 000 块英伟达H100 芯片,梁文锋就在2023 年凭借“想做”这股劲,成立了深度求索。

因此,深度求索必须想出更高效的方法训练它。他们使用了一系列工程技巧,比如优化芯片之间的通信方案、减少字段节省内存,以及创新地使用模型混合等。任何一个工程技巧都不是什么新方法,但结合在一起,却产生了尖端模型。其R1 模型在多项数学和推理基准测试中,击败了ChatGPT-o1。

德意志银行发布了一份报告,指出深度求索的崛起更像是人工智能的“斯普特尼克时刻”。

全球最大的书籍和论文共享网站“安娜的档案”发文称,包括深度求索在内 30多家人工智能公司与它建立了合作,以“捐赠”或者资源交换的方式,将数据库里数百万的各种语言的图书和论文分享给前者,供其训练。

尽管梁文锋并没有否认深度求索对ChatGPT的数据进行二次开发,但从回答效果、对中文的理解程度、推理的逻辑和深度等方面对比,使用深度求索与ChatGPT的体感完全不同。

也正因为在能力、成本和开放性等多个指标上的出类拔萃,深度求索被称为人工智能版的拼多多。再加上梁文锋 100 多人的初创团队,只招像罗福莉 (雷军想 千万年薪挖角) 一样的“天才”,终于让深度求索有了弯道超越和四两拨千斤的能力。

创新的大门肯定不会只开向一边,未来也不是“一夫当关,万夫莫开”的剑门关,创新和未来的树一旦掐去顶端优势,就会分化出无数的枝条,那才是人类文明该有的样子。

人工智能会改变什么?

如果ChatGPT像一把匕首,将通用人工智能的未来割开了一个口子,那么深度求索就像一把斧头,将口子撕扯得更大、更深,可以窥见更多可能性。

德意志银行发布了一份报告,指出深度求索的崛起更像是人工智能的“斯普特尼克时刻”。斯普特尼克是苏联第一颗人造卫星的名字。广义上说,斯普特尼克时刻是指美苏冷战中,科技给两国的政治走向带来的重要转折,让美国意识到自己在科技领域,特别是在航空技术上可能已经落后于苏联。

从某种意义上说,斯普特尼克时刻直接促成了一个以太空技术为核心的新的科技时代到来,人们由此进入太空时代。

深度求索的成功是否意味着中国人工智能进入斯普特尼克时刻,尚需观察;但由此引发的斯普特尼克效应,却明白无遗。

这意味着人工智能领域的竞争进入了新的阶段,大国之间在技术博弈中更可能刺刀见红。同时也意味着,人工智能领域的竞争结果可能对世界经济乃至政治格局产生深远影响。由人工智能应用开辟出来的医疗诊断、自动驾驶、智能制造、文案策划、法务财税等多个领域,都可能迎来颠覆性的变革。

宏观是微观的集合。张丹丹是北大国发院的资深教授之一,她长期关注劳动经济学。2022 年 11 月,ChatGPT发布后,她和团队从某头部招聘平台获取了 1 100种职业的上百万份招聘启事。拆解出了 2万多个岗位,衡量这些岗位被大语言模型影响的程度。

财务、审计、税务、翻译、银行、销售、软件和互联网开发……人工智能对脑力、规律、数据型的劳动替代度高,对蓝领、体力劳动者的替代程度低。

比如一部苹果手机的装配,需要有3 000 个工人,一只苹果手表的生产则需要 5 000 个工人。在精细手表里拧螺丝,目前机器还做不到。按照当前的技术进步程度,电子产品的组装仍然是高度劳动密集的,中国的大量制造业用工也集中在这个领域。

但这并不意味着随着人工智能操作越来越精细化,这类工作最终不会被替代。

文字处理几乎占据了目前人类高级工作的绝大部分,而在文本处理方面,人工智能就是一个天然可以提取、归纳文字,覆盖了人类所有知识的巨型图书馆。

深度求索是送给中国创业者和普通用户的新年礼物,一份盲盒,一个潘多拉,开出什么,生长出什么,不在于礼物本身。广义上,它让人工智能实现了全球平权。狭义上,它的使用提高了许多岗位和工作的下限,对有经验、有逻辑的老板凳们友好,对没有建立自己的知识体系、目标和经验有限、习惯于按部就班的年轻人产生了极大的危机。

不过年轻人就应该闯出新路。人类只能重新回到创造这条路上,将人工智能当作拐杖,拄着这根用人类智慧之光做成的拐杖,就是拄着人类的过去,去创造未来。

编 辑:朱作明 332080895@qq.com s3rhdlaqKwW5iDjtbMC0byzFYXoPMq25utERG6PLjhZ5z+pohrug7gHJYg6wgSqu

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开