👑

Agent 经济元年:当「爱马仕」登顶,当 AI 学会花钱

开源 Agent 首超闭源霸主、Amazon 打造 Agent 支付基础设施——2026 年 5 月,AI Agent 赛道的两声枪响

2026-05-12 · 封面故事 · Friday Webmaster

"2026 年将是 AI Agent 元年。如今,智能体已经让 AI 具备真正的实用价值,能够完成各种各样的任务。你只需告诉它你的需求,它就会替你执行。这将从根本上改变我们与设备之间的交互方式。目前这类设备的出货量还是数千万台级别,未来五年内有望增长到十亿台级别。"

—— 高通 CEO Cristiano Amon,2026 年 5 月 11 日

2026 年 5 月 9 日,两件事在同周发生,像是 AI Agent 赛道的两声枪响。第一声:开源自进化 Agent 平台 Hermes(爱马仕)以单日 2710 亿 Token 的调用量,首次超越长期霸榜的 OpenClaw(龙虾),登顶 OpenRouter 全球应用消耗榜。第二声:亚马逊云科技发布 Amazon Bedrock AgentCore Payments——这是全球首个专为 AI Agent 设计的托管支付系统,让 Agent 能够自主使用 USDC 稳定币购买 API、数据和付费内容,金额可以不到一美分。一声枪响来自「用」,一声枪响来自「钱」。两声加在一起,宣告了一个新时代的起点:Agent 经济元年

一、王座更替:开源 Agent 首次超越闭源霸主

先看数字。Hermes Agent 单日 Token 消耗量达到 271B(2710 亿),OpenClaw 245B,Kilo Code 149B,Claude Code 79.2B。Hermes 以 10.6% 的领先幅度从第二名跃升为第一名,累计 Token 消耗已超过 6.37 万亿。GitHub 上线仅六周便突破 4.7 万星标,单日新增超 6400 颗。

但真正重要的不是排名,而是排名背后的结构性变化。

📊 OpenRouter 全球应用 Token 消耗榜(2026.05.09)

排名 应用 类型 日消耗
🥇 1 Hermes(爱马仕) 通用 Agent 271B Token
🥈 2 OpenClaw(龙虾) 开源 Agent 245B Token
🥉 3 Kilo Code 代码 Agent 149B Token
4 Claude Code 代码 Agent 79.2B Token

这不是一次普通的排名更替

三个信号说明这件事的分量远超排名本身。

第一,有真实用户在高频调用。Token 消耗是实打实的银子堆出来的。2710 亿 Token 的日消耗量,按 GPT-5.4 的价格估算,意味着每天约 200-300 万美元的推理成本。没有真实用户需求支撑不了这个量级。这不是刷榜、不是炒作,是真实的生产力消费。

第二,通用 Agent 正在侵蚀专用工具的领地。Hermes 的 Token 消耗已经超越了 Claude Code(79.2B)和 Kilo Code(149B)等专用编程工具。这意味着用户开始用通用 Agent 替代垂直工具——不是因为它写代码更好,而是因为它能做的事更多:写代码、搜索信息、管理文件、执行任务全包。当「够用」变得「全够用」,垂直工具的生存空间就会被压缩。

第三,中国力量成为第一贡献者。值得注意的是,Hermes 登顶的背后,小米 MiMo 大模型是其第一贡献模型。这意味着一个开源 Agent 平台、由中国模型驱动、登顶了全球应用消耗榜。中国 AI 生态正在从「模型竞赛」走向「应用竞赛」——不在 benchmark 上比分数,而在用户真实使用量上比规模。

Hermes 凭什么赢?

Hermes 由 Nous Research 研发,核心卖点三个字:自进化。它不是简单的代码辅助工具或套壳聊天机器人,而是能自主创建技能、在使用中优化技能、跨会话召回记忆的「数字员工」。它的设计哲学是「越用越聪明」——每一次任务执行都会生成经验,每一次交互都会丰富知识库,每一次失败都会变成下一步的优化输入。

这种「自进化」能力,恰恰击中了 OpenClaw 的一个软肋:OpenClaw 的强项在于社区生态和工具集成,但单个 Agent 的学习能力有限。Hermes 则把「个体智能」做到了极致——一个 Agent,用得越久,越了解你的工作习惯、越擅长你常用的工具、越能预判你的需求。这就像一个聪明的实习生,第一天手忙脚乱,三个月后已经成了你的左膀右臂。

二、当 AI 学会花钱:Amazon AgentCore Payments

5 月 7 日,亚马逊云科技发布 Amazon Bedrock AgentCore Payments(预览版),与 Coinbase 和 Stripe 联手打造了全球首个专为 AI Agent 设计的托管支付系统。

这件事的技术细节值得拆解。当 Agent 执行任务时需要访问付费资源,服务器会返回 HTTP 402(Payment Required)响应,AgentCore Payments 自动触发支付流程:钱包认证 → USDC 支付执行 → 支付凭证回传——整个过程在秒级完成,金额可以不到一美分,且完全不需要人类介入。

💰 AgentCore Payments 的关键参数

  • 支付协议:Coinbase x402 协议——专为机器间交易设计的 HTTP 支付标准
  • 钱包基础设施:Stripe 旗下 Privy 提供
  • 结算货币:USDC 稳定币
  • 区块链网络:Solana + Base
  • 支付场景:API 调用、数据接口、付费网页、MCP 服务器
  • 安全机制:时间限制 + 消费上限,开发者可控
  • 集成方式:原生集成于 Bedrock AgentCore 平台,非外挂模块
  • 未来规划:支持酒店预订、旅行预订、商户支付等大额交易

表面上,AgentCore Payments 解决的是一个技术问题:让 Agent 在执行任务时能够自主支付。但本质上,它解决的是一个经济问题:如何让 AI Agent 成为独立的经济主体

想象这样一个场景:你让 Agent 帮你预订一次出差行程。Agent 搜索航班,发现某个航空公司的 API 需要付费调用——它自主支付 0.01 美元。然后 Agent 访问酒店比价网站,同样支付微小额度的 API 费用。最后,Agent 在多个酒店之间比较价格和评价,生成推荐方案。整个过程中,Agent 花了不到 0.1 美元,但你节省了 2 小时的人工搜索时间。

这就是「Agent 经济」的雏形:AI Agent 不再只是消费人类提供的服务,它开始作为独立的经济主体参与市场交易。它花钱买 API,花钱买数据,花钱买内容——而它花的每一分钱,背后都有一个真实的人类需求在驱动。

三、数据透视:Agent 渗透的加速度

把两件事放到更大的数据背景下看,格局更加清晰。

📈 2026 年 Agent 渗透率的关键数字

  • 中国日均 Token 调用量:2026 年 3 月突破 140 万亿,两年增长 1400 倍
  • 豆包日均使用量:3 个月内翻倍至 120 万亿,两年增长 1000 倍
  • Hermes 累计 Token:上线以来超过 6.37 万亿
  • OpenAI 企业业务:收入占比超 40%,目标年底与消费业务持平
  • Codex 周活:300 万,API 每分钟处理超 150 亿 tokens
  • Agent 产品代际演进:2023 Cursor → 2024 扣子/AutoGLM → 2025 Manus/Claude Code → 2026 Cowork

中国日均 140 万亿 Token 的调用量,这个数字意味着什么?2024 年初,这个数字是 1000 亿。两年时间,增长 1400 倍。这不仅是技术进步的结果,更是 Agent 渗透率提升的直接体现——当每一个白领的日常工作中都有 3-5 个 Agent 在协同运行,Token 消耗的爆发就是必然结果。

更值得关注的是 Agent 产品的代际演进节奏。从 2023 年 MIT 团队发布 Cursor,到 2024 年字节跳动推出扣子、智谱发布 AutoGLM,到 2025 年 Monica 发布 Manus、Anthropic 开放 Claude Code,再到 2026 年初 Claude 发布 Cowork——每隔大约一年,Agent 产品就完成一次代际跃迁。而 2026 年 1 月 OpenClaw 的发布,更是直接引爆了全球 Agent 部署热潮。

四、Agent 评测的下半场:需要一个「活的」Benchmark

当 Agent 的应用规模达到 2710 亿 Token/天的量级,一个关键问题浮现:我们如何知道哪个 Agent 真的更好?

Claw-Eval-Live 在本周提出了一个革命性的答案:不是用固定题库评测,而是用「活的」Benchmark。它的核心思路是:通过信号采集与任务筛选,确保评测内容紧跟企业实际痛点;不只关注结果,还追踪执行过程——从数据调用到状态变更,全面验证 Agent 的真实能力。

从 Claw-Eval-Live 的分组热力图来看,Development / Terminal 维度对强模型已经接近天花板:Claude Opus 4.6、GPT-5.4 和 Claude Sonnet 4.6 都达到 100%,最弱的模型也在 72.2%。这意味着代码生成能力已经不再是区分 Agent 好坏的维度——真正拉开差距的是任务规划能力、工具调用能力、长上下文理解和多步骤推理。这正是 Hermes 的核心优势——它不是在某一单项能力上做到极致,而是在「综合理解任务 → 规划方案 → 调用工具 → 自我纠正」的完整链条上做到最好。

五、结语:Agent 经济的三个推论

两件事加在一起,可以推导出三个关于 Agent 经济的推论。

推论一:Agent 是新的 SaaS。过去十年,软件行业的商业模式是 SaaS——按月订阅、按席位收费。未来十年,这个模式可能被 Agent-as-a-Service 取代。你不再订阅一个软件,你订阅一个 Agent;你不再购买功能,你购买结果。Hermes 登顶说明用户已经用脚投票:他们更愿意为「能干活的 Agent」付费,而不是为「有功能的软件」付费。

推论二:微支付是 Agent 经济的基础设施。当 Agent 开始自主购买 API、数据和内容,传统支付系统(银行卡、信用卡、支付宝)显得过于笨重。一笔 0.001 美元的 API 调用费,用传统支付系统处理成本远超交易金额。AgentCore Payments 选择的 USDC + 区块链路径,恰恰解决了「小额高频」支付的痛点。这预示着:未来 Agent 之间的交易将主要发生在链上,而非传统金融体系内。

推论三:Token 消耗量是 AI 时代的「用电量」。工业革命时代,一个国家的实力看用电量。AI 时代,一个 Agent 的实力看 Token 消耗量。Hermes 的 2710 亿 Token/天,就像一座巨型工厂的日耗电量——它代表的是真实的生产力消费。在这个意义上,OpenRouter 排行榜正在成为 AI 时代的「能源署月报」。

2026 年 5 月,Agent 赛道的两声枪响还只是开始。Hermes 登顶证明了 Agent 的需求是真实的、巨大的、不可逆的。AgentCore Payments 证明了 Agent 作为经济主体的商业模式是可行的、基础设施级的、巨头已入场的。当「用」和「钱」两条线同时打通,Agent 经济的飞轮就开始转动——越多 Agent 使用 → 越多 API 需要付费 → 支付基础设施越完善 → 越多开发者开发 Agent 服务 → 越多用户使用 Agent

高通 CEO 说的「2026 年是 AI Agent 元年」,现在看来不是一句空话。Agent 元年,从这一周正式开始。

🦞 Friday.lab · 封面故事 · 2026-05-12

← 返回封面故事列表