购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

“洁净技术”之谜

矿物已经成为AI的支柱,但其命脉仍然是电能。然而,高级计算很少考虑碳足迹、化石燃料和污染;像“云”这样的比喻象征着自然的、绿色的产业中的某种漂浮而微妙的东西。服务器隐藏在不起眼的数据中心之中,它们的污染水平远不如燃煤发电站浓烟滚滚的烟囱那么明显。科技部门大力宣传其环境政策、可持续性举措,以及利用AI作为解决气候相关问题的工具的计划。这一切都是一个没有碳排放的可持续技术产业的高度幻想的一部分。实际上,运行亚马逊网络服务或微软Azure的计算基础设施需要巨大的能量,这些平台上运行的AI系统的碳足迹是巨大的,而且还在不断增长。

简而言之,用学者胡东辉的话说,“云是一种资源密集型的提取技术,它将水和电转化为计算能力,造成相当大的环境破坏,但它把公共视线从这方面转移了。”而这种巨大的能源密集型基础设施几乎完全是私人的。当然,业界一直在努力提高数据中心的能效,并增加对可再生能源的使用。但是,全世界计算基础设施的碳足迹已经与航空业的碳足迹相当,并且还在以更快的速度增长。估算结果各不相同,卢特菲·贝尔基尔(Lotfi Belkhir)和阿迈德·埃尔梅利吉(Ahmed Elmeligi)等研究人员估计,到2040年,科技行业的排放量将占全球温室气体排放量的14%,而瑞典的一个研究团队预测,到2030年,仅数据中心的电力需求就将增加约15倍。

通过仔细观察构建AI模型所需的计算能力,我们可以看到,对速度和精度呈指数级增长的渴望是如何让地球付出高昂代价的。AI训练模型的计算需求及其能耗仍然是一个新兴的研究领域。该领域的一篇早期论文发表于2019年,由马萨诸塞大学阿默斯特分校的AI研究员艾玛·斯特贝尔(Emma Strubell)和其团队完成。他们的研究主题是自然语言处理(Natural Language Processing,NLP)模型的碳足迹,并通过在数十万个计算小时内运行AI模型来估算其碳足迹。最初的数字令人震惊。斯特贝尔的团队发现,仅运行一个NLP模型就产生了30万千克的二氧化碳排放量,相当于5辆汽油动力汽车的整个使用寿命(包括其制造)的排放量,或一架航班从纽约到北京往返125次的排放量。

更糟糕的是,研究人员指出,这种建模只是一种底线上的乐观估计。它并没有反映像苹果和亚马逊这样的公司的真正商业规模,它们在互联网范围内收集数据集,并提供自己的NLP模型,以使Siri和Alexa等AI系统听起来更自然。但科技部门的AI模型所产生的能源消耗的确切数据尚不清晰;这些信息作为公司的高度机密被保存。在这方面,数据经济也是以保持对环境的无知为前提的。

在人工智能领域,根据“越大越好”的信念,标准做法是为了提高性能将计算周期最大化。正如DeepMind 公司的里奇·萨顿(Rich Sutton)所描述的,“利用计算的方法最终是最有效的,而且远比其他方法更有效。”AI的测试运行中使用的强力测试计算技术,以及系统地收集更多数据并使用更多计算周期,直到获得更好的结果的做法,已经推动了巨大且不断增长的能源消耗。开放智能(OpenAI )估计,自2012年以来,用于训练单个AI模型的计算量以每年10倍的速度增长。这是因为开发人员“反复寻找并行使用更多芯片的方法,并愿意为此付出经济成本”。仅从经济成本的角度考虑问题,而罔顾对当地环境造成的更为广泛的代价,就会使我们狭隘地将计算循环中的能源消耗视为一种提高增量效率的方式。“计算至上主义”(compute maximalism)的趋势具有深远的生态影响。

数据中心是世界上最大的电力消费者之一。为这样的多级设备供电需要煤、天然气、核能或可再生能源提供的电力。一些公司正在对关于大规模计算能耗日益增长的警告做出回应,苹果和谷歌声称它们是碳中和 企业(这意味着他们通过购买信用来抵消碳排放),微软承诺到2030年实现碳排放量为负值。但是这些公司内部的技术工人一直在敦促董事会推动实际减排,而不是出于对环境的内疚而购买赎罪券。此外,微软、谷歌和亚马逊都将其AI平台、工程人员和基础设施授权给化石燃料公司,以帮助它们定位并从地下提取燃料,这进一步导致这个行业成为对人为气候变化负有最大责任的行业。

水资源提供了计算真实成本的另一个故事。美国用水的历史上充满了战争和秘密交易,与计算一样,关于水的交易也是保密的。美国目前建造的最大的数据中心属于犹他州布拉夫代尔的美国国家安全局(National Security Agency,NSA)。自2013年年底投入使用以来,犹他数据中心并不对外开放。但驱车经过邻近的郊区,我在一座长满山艾树的山上找到了一条死路,从那里我可以更近距离地观察这座占地约11.1公顷的设施。该地在政府数据采集时代具有某种象征性的力量,曾在《第四公民》( Citizen Four )等电影中出现,并在数千个有关NSA的新闻报道中出现过。然而,就我个人而言,我觉得它不伦不类、平淡无奇,就是一个巨大的储物容器与一座政府办公大楼的结合体。

鉴于数据中心位于干旱的犹他州,在其正式投入使用之前,关于水资源的争夺就已经开始了。当地记者想确认每天170万加仑水的估计消耗量是否准确,但NSA最初拒绝分享实际用水数据,删除了公共记录中的所有细节,并声称其用水量事关国家安全。反监视活动人士编写了手册,停止为监视水和能源提供物质支持,并声称对用水进行法律控制有可能会导致全中心停止运转。布拉夫代尔市已经与NSA达成了一项多年协议,根据协议,该市将以远低于平均水平的价格出售水,以换取该设施可能给该地区带来经济的增长。无论从哪个角度讲,水的地缘政治现在已经与数据中心的机制和政治、计算以及权力深度结合。从可以俯瞰NSA数据储存库的干燥山坡上来看,所有关于水的争论和困惑都是有道理的:这是一个有界限的景观,这里的社区和栖息地赖以生存的水都被带走用来冷却服务器了。

正如采矿业的肮脏工作远离获利最多的公司和城市居民一样,大多数数据中心也远离主要的人口中心,无论是在沙漠还是半工业化的远郊地区。这让我们感觉云离开了我们的视线,被抽象化了,但事实是它在根本上是物质的,并以远未得到充分认识和解释的方式影响着环境和气候。云属于地球,要保持其增长,就需要不断扩展的资源储备和始终运行的物流和运输网络。 5SIIhjwOyzluw2w67pwr7zworDA5roYR4wkK0O1XkpkJvHr78fSUBYRN1ao3h7iQ

点击中间区域
呼出菜单
上一章
目录
下一章
×