同一周,三层基础设施全部就位——Agent 的 1995 时刻来了

同一周,三层基础设施全部就位——Agent 的 1995 时刻来了

Vercel Eve、Databricks Omnigent、Google ARD 同一周发布,分别解决 Agent 的建造、编排和发现问题。三层基础设施同时就位,就像1995年 HTTP+Apache+DNS 同时成熟催生了 Web 爆发。Agent 领域的临界点到了。

发布于 2026/06/18
更新于 2026/06/24
20 分钟阅读
20 次阅读

这周我刷到了三条新闻,单独看每一条都觉得「哦,又一个开源框架」,没什么特别的。但当我把它们放在一起的时候,后背有点发凉。

第一条,Vercel 发布了 Eve,一个开源的 AI Agent 框架。

第二条,Databricks 开源了 Omnigent,一个「元框架」,坐在所有 Agent 框架之上。

第三条,Google 联合微软、NVIDIA、Hugging Face 等十几家公司,发布了一个叫 ARD 的开放规范。

三件事,同一周。三个完全不同的团队,解决三个完全不同层次的问题,但指向同一个判断。

我觉得这个巧合本身,就是一个信号。

先快速说一下这三个东西各自是什么吧。

Eve 是 Vercel 做的。你知道 Vercel 吧,就是做 Next.js 那家公司,前端开发者的精神家园那种。他们的核心观点是,现在做 Agent 的体验,就像2013年之前做网站的体验,每个人都在重复造轮子,搞路由、搞部署、搞状态管理,一堆重复劳动,搞得你写业务逻辑的时间还不如搞基础设施的时间长。Next.js 终结了做网站的这种混乱,Eve 想对 Agent 做同样的事。

说真的,Eve 的设计哲学让我觉得挺优雅的。在它的体系里,一个 Agent 就是一个文件目录。目录结构本身就是这个 Agent 的全部定义。你往 tools/ 文件夹里丢一个 TypeScript 文件,Agent 就自动获得了一个新工具。你往 skills/ 里丢一个 Markdown,Agent 就学会了一个新领域的知识。不需要胶水代码,不需要注册流程,文件即能力。Vercel 自己已经在内部跑了上百个 Agent 了,Eve 就是他们内部用的东西直接开源出来的。上百个。不是三五个实验 demo,是上百个跑在生产环境里的 Agent。

Omnigent 是 Databricks 做的,但它不是「又一个 Agent 框架」。这块需要注意一下,它管自己叫「meta-harness」,元框架。什么意思呢?它不替代 Claude Code,不替代 Codex,不替代 Pi,它坐在这些东西的上面,让它们变成同一个团队的成员。你可以想象成,Eve 是让你造出一个好用的士兵,而 Omnigent 是让你指挥一支军队。

Omnigent 的博客里有句话我印象很深,「the frontier of agent engineering is moving up a level」,Agent 工程的前沿正在往上移一层。而且这个项目是 Matei Zaharia 亲自参与写代码的,包括前端代码。Matei 是谁?Apache Spark 的创造者,Databricks 的联合创始人,大数据时代的奠基人之一。反正我觉得,这种级别的人亲自下场写代码,不是在那儿当顾问指点江山,是真的在写,说明他判断这件事的重要性到了必须亲自动手的程度。

ARD 是 Google 牵头的,但不是 Google 一家的东西。微软、Databricks、Hugging Face、NVIDIA、Cisco、Salesforce、Snowflake 都参与了。你看看这个名单,基本上是把硅谷能叫得上号的科技公司全拉进来了。ARD 全称 Agentic Resource Discovery,翻译过来就是「智能体资源发现」。它解决的问题很纯粹,当你的 Agent 需要一个能力的时候,比如它需要查一个数据库、调一个API、找另一个 Agent 帮忙,它怎么知道去哪找?现在的答案是,你手动配置。你告诉它「这个工具在这个地址」,一个一个接上去。但当 Agent 越来越多、能力越来越碎片化的时候,手动配置就完全不够用了。ARD 就是 Agent 世界的 DNS。你在自己的域名下发布一个目录,描述你有什么能力可以提供,然后有个去中心化的索引系统可以搜到你。Agent 不再需要预先知道所有工具在哪里,它可以在运行时动态发现。

好了,三个东西介绍完了。

现在你把它们叠在一起看。

Eve 解决的是「怎么造一个 Agent」。

Omnigent 解决的是「怎么让多个 Agent 协作」。

ARD 解决的是「Agent 怎么在互联网上找到彼此」。

三个不同的层次。建造层、编排层、发现层。同一周,同时出手。

建造层、编排层、发现层——同一周全部就位

我不知道你有没有跟我一样的感觉,但这个画面让我一下子想起了一段历史。

1990年代初期,互联网其实已经存在了很多年了。TCP/IP 协议跑了十几年了,大学和研究机构之间早就能互相传数据。但为什么 Web 直到1995年前后才真正爆发?不是因为某一个杀手级应用突然出现了,而是因为那几年里,有三件事几乎同时成熟了。

第一,HTTP 协议稳定了,浏览器有了标准的方式来请求和渲染网页。第二,Web 服务器成熟了,Apache 让任何人都可以用很低的成本把自己的内容放到互联网上。第三,DNS 系统完善了,你不需要记住一个 IP 地址才能找到你想去的地方,输入一个域名就行。

协议、运行时、发现机制。三层同时就位,Web 才从「技术圈的玩具」变成了「所有人的基础设施」。

1995 vs 2026——历史在押韵

我是真的觉得,现在 Agent 领域正在发生一模一样的事情。

MCP 就是 Agent 世界的 HTTP。Anthropic 去年底发布的 Model Context Protocol,定义了 Agent 和工具之间怎么对话的标准协议。现在已经被几乎所有主流框架采纳了,Eve 原生支持 MCP 连接,ARD 里发现的资源也可以是 MCP 服务器。它已经变成了事实标准。

Eve 这类框架就是 Agent 世界的 Apache。它让造一个 Agent、部署一个 Agent 变得极其简单,就像 Apache 让任何人都能搭一个网站一样。你不需要是分布式系统专家才能让一个 Agent 跑在生产环境里,Eve 把持久化执行、沙箱隔离、人工审批这些生产级的能力全部内置了。

ARD 就是 Agent 世界的 DNS。它让 Agent 之间可以互相发现,不需要提前硬编码知道对方在哪里。去中心化的,基于域名的,开放的。

三层同时就位。

这不是巧合。这是行业共识翻过临界点的信号。

你想想看,为什么 Vercel 要在这个时候做 Eve?他们的博客说得很直白,「我们内部做了上百个 Agent,发现每个团队都在重复造同样的轮子」。这句话的信息量很大。它意味着在 Vercel 内部,Agent 的数量已经多到了需要框架来管理的程度。不是三五个实验项目,不是一个demo给投资人看,是上百个跑在生产里的 Agent,多到不用框架就会混乱的程度。

为什么 Databricks 要做 Omnigent?其实吧,原因也很朴素。他们发现行业里最好的实践已经不是「一个超强 Agent 搞定一切」了。他们博客里举了几个例子,Harvey(一家法律 AI 公司)靠的不是一个超强模型,而是让一个开源的工人模型去咨询一个前沿的顾问模型,两个模型配合反而比单一强模型效果好还便宜。Anthropic 自己的 Deep Research 产品也是一个主 Agent 调度多个并行的子 Agent。Databricks 自己的 Genie 用不同的模型分别做规划、搜索和代码生成。最好的结果不再来自单一模型加单一框架,而是来自多模型、多框架、多角色的组合。

为什么 Google 要拉十几家公司一起做 ARD?因为当 Agent 足够多的时候,「怎么找到对的那个」就变成了核心问题。怎么说呢,就像互联网上的网站多到一定程度,Yahoo 的人工分类目录就不够用了,你需要 Google 这样的搜索引擎来帮你在海量信息里找到你要的那个。Agent 多到一定程度,手动配置连接就不够用了,你需要一个自动发现机制。

每一个决策背后,都是同一个判断,Agent 的数量和复杂度已经到了需要新一层基础设施的临界点。

顺着这个再聊聊 Omnigent 里的一个概念,因为我觉得它特别有启发性。

他们管自己叫「meta-harness」。harness 这个词,在 Agent 语境里,指的是把一个裸模型变成一个可以干活的 Agent 的那层壳。Claude Code 是一个 harness,它把 Claude 模型包上了终端操作能力、文件系统访问、上下文管理这些东西。Codex 也是一个 harness,Cursor 也是。每个 harness 有自己的界面、自己的上下文窗口管理方式、自己的工具调用方式。

问题在于,这些 harness 之间是互相隔离的。你在 Claude Code 里的对话上下文,Codex 完全看不到。你在 Cursor 里积累的项目理解,Pi 也不知道。它们各自为政。

Omnigent 说,我不关心你底下用的是哪个 harness,我坐在上面,给你提供三样东西。第一是组合,你可以把不同 harness 的 Agent 放在同一个任务里协作。第二是控制,你可以在元层面设置策略,比如「一个 Agent 花到100美元就暂停来问我」,或者「Agent 如果刚下载了一个 npm 包然后要 git push,必须先让我批准」。第三是协作,你可以邀请同事进来,一起看 Agent 在干什么,一起给它方向。

这让我想到了什么?

Docker 和 Kubernetes 的关系。

Docker 让你很容易造一个容器,打包一个应用。但当你有几十个、几百个容器在跑的时候,你需要 Kubernetes 来编排它们,告诉它们谁跑在哪里、谁跟谁通信、谁挂了怎么办。Kubernetes 不替代 Docker,它坐在 Docker 上面,解决的是「多个容器怎么协调成一个系统」的问题。

Omnigent 对 Agent harness 做的事,跟 Kubernetes 对 Docker 做的事,在结构上一模一样。

从一个 Agent 到一支队伍

而如果历史的韵脚是准确的话,我们可以做一个大胆的推测。

Docker + Kubernetes 的成熟,催生了整个云原生时代。从微服务架构到 Serverless,从 CI/CD 到 DevOps,整个现代软件工程的工作方式都被这两层基础设施重塑了。在它们成熟之前,没有人能想象今天我们做软件的方式。

Agent 框架 + 元框架 + 发现层的成熟,会催生什么?

坦率的讲,没人知道。包括做这些东西的人自己,我觉得他们也只有模糊的方向感,没有确切的答案。

但我有一个直觉,或者说一个画面。

以后你用 AI 的方式,可能跟现在完全不同。现在你打开 ChatGPT,跟一个 AI 对话,一问一答,说到底还是「你和一个助手」的关系。但以后呢?你可能说一句「帮我搞定这件事」,然后背后有五六个 Agent 被动态组装起来,一个负责搜索信息,一个负责写代码,一个负责验证结果是否正确,一个负责跟你的日历和邮件对接,还有一个负责协调前面这几个。你看到的还是一个界面,但背后是一个临时组建的团队在协作。

就像你现在打开淘宝下一个单,看到的是一个「购买」按钮,但背后可能有二十几个微服务在互相调用,库存服务、支付服务、物流服务、推荐服务、风控服务,你不需要知道它们的存在,但正是它们的存在让这个按钮能真正把东西送到你手上。

Agent 的未来大概率也是这样。你不需要知道有几个 Agent 在帮你,你只需要知道事情搞定了。

这就是为什么 ARD 特别重要。如果每个 Agent 都需要你手动配置、手动连接、手动告诉它「这个工具在这个地址」,那多 Agent 协作永远只能是程序员的玩具。只有当 Agent 能自动发现彼此、自动协商能力、自动组队的时候,这件事才能真正走向大众,真正规模化。

ARD 做的就是这件事。它让任何一个 Agent 都可以在运行时说「我需要一个能查物流信息的能力」,然后自动在网上找到提供这个能力的服务,验证它的身份和可信度,建立安全连接,完成任务。用完就走,下次需要别的能力再找别的。

去中心化的。开放的。就像 Web 本身一样。

其实你回想一下过去两年 AI 行业的演进,会发现一条很清晰的线。

2024年,大家在卷模型。谁的参数多、benchmark 分高、上下文窗口长,谁就牛逼。那一年的关键词是 GPT-4、Claude 3、Gemini,是模型能力的军备竞赛。

2025年,开始卷 Agent。单个模型再强,坐在那里不动也没用,要给它工具、给它记忆、让它能执行动作、让它能跟真实世界交互。Claude Code、Cursor、Devin、Computer Use,都是这一波的产物。关键词是「让 AI 能动手干活」。

2026年,现在,开始卷基础设施。单个 Agent 也不够了,要让多个 Agent 协作、发现彼此、互相委派任务、形成系统。Eve、Omnigent、ARD,是这一波的开端。关键词从「一个 Agent 能干什么」变成了「一群 Agent 怎么一起干活」。

2024卷模型→2025卷Agent→2026卷基础设施

每一轮都在往上叠一层。每一层的叠加都让下面一层变成了理所当然的存在,变成了不需要讨论的背景。就像现在没人会说「我用了 TCP/IP 协议来上网」一样,以后也没人会说「我用了一个 Agent 来帮我做事」。它就在那里,像水和电一样,你打开龙头它就来了。

Matei Zaharia 在 Omnigent 的博客里写了一句话,我觉得是整件事最好的注脚,「Many of the biggest shifts in our industry came from moving to a new layer of abstraction」。我们这个行业里最大的变革,每一次,都来自于移动到新的一层抽象。

从汇编到高级语言是一层。从手动管理进程到容器编排是一层。从单机到云是一层。每一次新的抽象层出现,都不只是让工程师更轻松了,而是让一整类之前完全不可能的应用变得可能了。没有云和容器,就没有 Netflix 和 Uber 的技术架构。没有 HTTP 和 DNS,就没有 Google 和 Amazon。

现在 Agent 领域正在经历同样的事。三层基础设施同一周就位,不是三家公司碰巧撞到了一起,而是整个行业到了一个临界点,到了必须往上再叠一层的时候。所有人都感受到了这股力量,所以所有人同时动手了。

就像1995年的 Web,所有底层的管道都铺好了。

剩下的事情,就是等着看谁会在这些管道上面,建出第一个 Google。

说实话我也不知道那个东西会是什么形态,但想想就觉得兴奋。

这周这三条新闻,我一开始以为是三条独立的产品发布,刷过去就算了。写到这里我才意识到,它们是同一首交响曲的三个声部。低音是 Eve,给你造 Agent 的标准化工具。中音是 Omnigent,让 Agent 们学会协作和被管理。高音是 ARD,让整个互联网变成 Agent 可以自由探索的开放舞台。

三个声部同时响起来的那一刻,就是新乐章开始的信号。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

/ 作者:青玉白露

延伸阅读

  • Google 花 27 亿请回来的人,不到两年又跑了·AI叙事的终局在哪?:「Transformer 之父」Noam Shazeer 从 Google 跳去 OpenAI,27 亿美元的回家礼保质期不到两年。同一周,OpenAI 年亏 209 亿的财报曝光,G7 峰会密谋组建 AI 排华联盟,中国同日宣布筹建世界 AI 合作组织。把这几条线放在一起看,你会发现它们不是独立事件,而是同一股力量撕出的三道裂缝。
  • 如何判断一个AI产品是不是在忽悠你:AI行业色素水浓度有点高。四层鉴伪框架教你识别:看技术在哪里、看有没有护城河、看它怎么说话、看它敢不敢让你试。知识不是用来炫耀的,是用来防身的。
  • Prompt Engineering,用自然语言给AI编程的技术:Prompt Engineering不是那些满天飞的万能模板,而是一种用自然语言给AI编程的能力。五个核心原则、Context Engineering的进化、以及为什么你说话的方式决定了AI能帮你到什么程度。
  • AI Agent,当AI学会自己搞定一整件事:AI Agent是Fine-tuning、Function Calling、MCP三大技术的集大成者。这篇文章从聊天机器人和Agent的本质区别讲起,拆解Agentic Loop的工作机制,坦诚讨论复合错误率的现实挑战,最终回答一个问题:当AI学会独立完成任务,什么能力变得更重要了?

评论区

欢迎留下你的看法,支持匿名评论。

你的评论会公开展示,建议填写便于交流的昵称,并尽量提供有信息量的反馈。