AI的账单到了

AI的账单到了

花旗限制旗舰模型、扎克伯格承认Agent不如预期、谷歌用电量超新西兰——三条新闻串起同一个转折:从不计代价追求能力到在成本约束下找最优解。免费午餐阶段结束了。

发布于 2026/07/03
更新于 2026/07/03
6 分钟阅读
1 次阅读

这周有一组数据让我停下来想了很久。

404 Media拿到了一份内部资料,显示花旗银行、Adobe、Atlassian等至少六家大企业正在限制员工使用AI旗舰模型。原因很直接,太贵了。Atlassian的月度AI开销从去年8月的500万美元涨到了今年5月的1500万美元,三倍增长只用了九个月。花旗银行6月24号下了内部限制令,直接禁掉了Claude Opus 4.6、4.7和GPT-5.5,通知里的原话是「这些模型每次交互消耗的AI Credits显著更多」。

同一天,Reuters拿到了Meta内部全体会议的录音。扎克伯格在会上承认,AI Agent的开发「过去四个月没有按预期加速」。今年年初他裁了8000人、调了7000人到AI团队,说2026年是AI dramatically change Meta的一年。四个月过去了,他自己说「这些押注还没有结出果实」。

然后是谷歌的环境报告。2025年,谷歌全年用电量同比暴增37%,数据中心年耗电超4200万兆瓦时。这个数字超过了新西兰全国的用电量。自2019年以来,谷歌总用电量增长超过250%。

三条新闻,一个共同主题。

AI的账单到了。

过去两年,所有关于AI的叙事都围绕着能力在转。模型越来越强,能做的事越来越多,效率提升越来越大。这些都是真的。但有一个话题一直被压在桌子底下,就是这些能力的代价是什么。现在代价正在浮出水面,而且来势凶猛。

企业层面,最直接的代价是API调用费。当你让几千名员工每天都在用Claude Opus或者GPT-5的时候,账单会以一种让CFO心跳加速的速度增长。花旗的做法很有代表性,它不是不让用AI,而是强制降级,要求员工用能力较弱但便宜得多的模型。Adobe和Atlassian也在做类似的事。

这跟GPT-5.6分成Sol/Terra/Luna三个层级是同一个逻辑。不是所有任务都需要最强的模型。问题是之前没人想过这件事,因为之前用量还没大到需要想。现在用量上来了,账单也跟着上来了。

基础设施层面,代价是电。训练一个前沿模型需要的算力,折算成电费是数亿美元级别的。谷歌的数据说明了一切,一家公司的用电量比一个发达国家还多,而且还在以每年37%的速度增长。这种增速不可能持续。不是说谷歌付不起电费,而是物理世界的电力供应跟不上。新建一个数据中心需要三到五年,新建一座核电站需要十年以上。AI的算力需求增长速度远远超过了电力基础设施的建设速度。

扎克伯格承认Agent开发不如预期,跟成本问题是一体两面。Meta今年承诺在AI基础设施上投1450亿美元,但钱花下去了,预期的产出没跟上。不是技术不行,而是从能力到落地之间的距离,比想象的远。你花几十亿训了一个很强的模型,但要让它稳定地、可靠地、低成本地跑在真实业务里,那是另一套完全不同的工程问题。

我觉得这里面有一个认知偏差正在被修正。

过去两年,很多人把AI的能力进步等同于商业价值的增长。模型在benchmark上的分数越来越高,所以AI的价值越来越大。但benchmark分数和实际ROI之间有一个巨大的鸿沟。一个模型在SWE-bench上能解决80%的编程任务,不等于它能帮一家公司省80%的工程师成本。中间隔着可靠性、集成成本、维护成本、合规成本。

企业开始限制旗舰模型,其实就是在说,那个80%的benchmark分数给我们带来的实际价值增量,不值那个价格差。用一个60%准确率但便宜五倍的模型,实际业务效果差不多。

说真的,这让我想到互联网行业的一段历史。

2000年代初,互联网公司也经历过一次「物理代价」的觉醒。当时所有人都在疯狂建数据中心,后来发现电费和冷却成本会吃掉利润。Google发明了定制化低功耗服务器,Facebook把数据中心建在北极圈。整个行业花了十年时间学会了怎么高效地使用计算资源。

AI行业现在在经历类似的时刻。从「不计代价追求能力」到「在成本约束下寻找最优解」的转变刚刚开始。Sol/Terra/Luna的三层分化、企业的模型降级策略、谷歌的能耗困境,都是这个转变的早期信号。

免费午餐阶段结束了。接下来是算细账的阶段。

谢谢你看我的文章,我们,下次再见。

/ 作者:青玉白露

延伸阅读

评论区

欢迎留下你的看法,支持匿名评论。

你的评论会公开展示,建议填写便于交流的昵称,并尽量提供有信息量的反馈。