这周有一组数据让我停下来想了很久。
404 Media拿到了一份内部资料,显示花旗银行、Adobe、Atlassian等至少六家大企业正在限制员工使用AI旗舰模型。原因很直接,太贵了。Atlassian的月度AI开销从去年8月的500万美元涨到了今年5月的1500万美元,三倍增长只用了九个月。花旗银行6月24号下了内部限制令,直接禁掉了Claude Opus 4.6、4.7和GPT-5.5,通知里的原话是「这些模型每次交互消耗的AI Credits显著更多」。
同一天,Reuters拿到了Meta内部全体会议的录音。扎克伯格在会上承认,AI Agent的开发「过去四个月没有按预期加速」。今年年初他裁了8000人、调了7000人到AI团队,说2026年是AI dramatically change Meta的一年。四个月过去了,他自己说「这些押注还没有结出果实」。
然后是谷歌的环境报告。2025年,谷歌全年用电量同比暴增37%,数据中心年耗电超4200万兆瓦时。这个数字超过了新西兰全国的用电量。自2019年以来,谷歌总用电量增长超过250%。
三条新闻,一个共同主题。
AI的账单到了。
过去两年,所有关于AI的叙事都围绕着能力在转。模型越来越强,能做的事越来越多,效率提升越来越大。这些都是真的。但有一个话题一直被压在桌子底下,就是这些能力的代价是什么。现在代价正在浮出水面,而且来势凶猛。
企业层面,最直接的代价是API调用费。当你让几千名员工每天都在用Claude Opus或者GPT-5的时候,账单会以一种让CFO心跳加速的速度增长。花旗的做法很有代表性,它不是不让用AI,而是强制降级,要求员工用能力较弱但便宜得多的模型。Adobe和Atlassian也在做类似的事。
这跟GPT-5.6分成Sol/Terra/Luna三个层级是同一个逻辑。不是所有任务都需要最强的模型。问题是之前没人想过这件事,因为之前用量还没大到需要想。现在用量上来了,账单也跟着上来了。
基础设施层面,代价是电。训练一个前沿模型需要的算力,折算成电费是数亿美元级别的。谷歌的数据说明了一切,一家公司的用电量比一个发达国家还多,而且还在以每年37%的速度增长。这种增速不可能持续。不是说谷歌付不起电费,而是物理世界的电力供应跟不上。新建一个数据中心需要三到五年,新建一座核电站需要十年以上。AI的算力需求增长速度远远超过了电力基础设施的建设速度。
扎克伯格承认Agent开发不如预期,跟成本问题是一体两面。Meta今年承诺在AI基础设施上投1450亿美元,但钱花下去了,预期的产出没跟上。不是技术不行,而是从能力到落地之间的距离,比想象的远。你花几十亿训了一个很强的模型,但要让它稳定地、可靠地、低成本地跑在真实业务里,那是另一套完全不同的工程问题。
我觉得这里面有一个认知偏差正在被修正。
过去两年,很多人把AI的能力进步等同于商业价值的增长。模型在benchmark上的分数越来越高,所以AI的价值越来越大。但benchmark分数和实际ROI之间有一个巨大的鸿沟。一个模型在SWE-bench上能解决80%的编程任务,不等于它能帮一家公司省80%的工程师成本。中间隔着可靠性、集成成本、维护成本、合规成本。
企业开始限制旗舰模型,其实就是在说,那个80%的benchmark分数给我们带来的实际价值增量,不值那个价格差。用一个60%准确率但便宜五倍的模型,实际业务效果差不多。
说真的,这让我想到互联网行业的一段历史。
2000年代初,互联网公司也经历过一次「物理代价」的觉醒。当时所有人都在疯狂建数据中心,后来发现电费和冷却成本会吃掉利润。Google发明了定制化低功耗服务器,Facebook把数据中心建在北极圈。整个行业花了十年时间学会了怎么高效地使用计算资源。
AI行业现在在经历类似的时刻。从「不计代价追求能力」到「在成本约束下寻找最优解」的转变刚刚开始。Sol/Terra/Luna的三层分化、企业的模型降级策略、谷歌的能耗困境,都是这个转变的早期信号。
免费午餐阶段结束了。接下来是算细账的阶段。
谢谢你看我的文章,我们,下次再见。
/ 作者:青玉白露
延伸阅读
- AI公司正在失去定义自己边界的能力:OpenAI主动送5%股权,Anthropic被五角大楼逼拆护栏。看似截然不同的选择,底层逻辑一样:AI公司的独立性窗口正在关闭。互联网公司走了二十年的路,AI只用了四年。
- 给 AI 注入品味:当编码工具性能趋同,审美成了新战场:Emil Kowalski把十年前端经验打包成Skill文件注入AI编码工具、Kimi K2.7成为GitHub Copilot首个开源权重模型、Senior SWE-Bench评估高级工程师任务——当性能不再是瓶颈的时候,品味就成了新的战场。
- Agent 嵌入一切:从支付宝到群聊,AI 正在吞噬 App:支付宝阿宝开放公测、Skywork Tags让Agent加入工作群聊、千问Agent工程方法论——三件事串在一起看,2026下半年Agent的主旋律已经很清楚了:Agent的终局不是做一个新App,而是消失在你已有的工作流和生活流里。
- 一家AI安全公司做了一件最不安全的事:Anthropic发布最强中端模型Sonnet 5的同时,被发现在Claude Code中植入隐写术追踪中国用户。一面递刀一面藏刀,AI安全公司的透明度悖论。

评论区
欢迎留下你的看法,支持匿名评论。
你的评论会公开展示,建议填写便于交流的昵称,并尽量提供有信息量的反馈。