内参III:OpenClaw全球智能体竞赛 · 龙虾催生的两个世界
AI 导读
内参系列 · Special Report · 第 III 期 深度洞察 2026 年 3 月 3 日 · 技术与产业 · 内参报告第 III 期 主动智能体 · 全球竞赛 龙虾催生的两个世界:从 pi 引擎到 Frontier,OpenClaw 智能体竞赛的全球路径分裂与终局推演 当硅谷把智能体当"新员工"来管理,中国大厂把它变成"云上即插即用的 SKU",而国产模型厂商纷纷推出...
龙虾催生的两个世界:从 pi 引擎到 Frontier,OpenClaw 智能体竞赛的全球路径分裂与终局推演
当硅谷把智能体当"新员工"来管理,中国大厂把它变成"云上即插即用的 SKU",而国产模型厂商纷纷推出 KimiClaw、MaxClaw、AutoGLM 时——这场由一只开源龙虾引发的全球竞赛,正以超出所有人预期的速度分裂为两套截然不同的产业答案。
📋 内参系列导航
在第二期内参中,我们深入拆解了 OpenClaw 底层的 pi 引擎如何通过四个极简工具——Planner、Hook、ToolMaker 与 Executor——实现对 Claude Code 八工具架构的"降维打击",以及这种极简主义哲学在 Token 经济学上的深远意义。如果说那期报告回答的是"OpenClaw 为什么强",那么本期将回答一个更宏大的问题:当一只开源龙虾点燃全球智能体竞赛后,硅谷和中国各自跑向了哪里?谁会赢?
答案比多数人想象的更复杂。截至 2026 年 3 月 3 日,这场竞赛已不再是一场简单的技术对标,而是分裂为三条截然不同的路径:硅谷的"企业级控制平面"路线、中国云厂的"托管化即插即用"路线,以及中国模型厂商的"品牌化 Claw 变体"路线。每条路径背后,是完全不同的商业逻辑、安全哲学和生态博弈。
截至 2026.3.2
含 1,184 个恶意技能
OpenClaw 控制面板
全球流量来源
港股市值(港元)
最新估值
一、回顾:pi 引擎为何重要
在第 II 期报告中,我们详细分析了 OpenClaw 底层 pi(Programmable Intelligence)引擎的核心创新。当 Claude Code 用八个硬编码工具(Bash、ReadFile、WriteFile、Replace、Glob、View、Ask、Notebook)试图覆盖开发者所有操作时,OpenClaw 反其道而行之,提出了一个颠覆性命题:工具越多,智能体越笨。
pi 引擎将这八个工具精简为四个——Planner(规划器)、Hook(钩子)、ToolMaker(自我工具生成器)和 Executor(执行器),构成了一个完美的感知-决策-执行-进化闭环。其中,Planner 强制 LLM 在行动前输出包含回滚策略和验证标准的结构化蓝图;Hook 通过事件驱动取代了 Token 浪费严重的轮询模式;ToolMaker 让 AI 自写临时脚本而非依赖正则替换;Executor 在沙盒环境中运行一切命令。这套架构在典型重构任务中实现了 82% 的成功率提升和 65% 的 Token 消耗降低。
理解 pi 引擎的"少即是多"哲学,是理解后续全球竞赛路径分裂的关键前提——正是 OpenClaw 证明了:当底层引擎足够聪明时,做减法才是通向通用智能体的正确路径。这一判断深刻影响了后续所有跟进者的架构选择。
二、全球格局:三条路径的大分裂
我们将当前的竞争格局划分为三大阵营,每条路径的背后都有一套完整的产业逻辑。
路径一:硅谷 ——"企业级智能体控制平面"
硅谷的关键动作是把智能体当成"新员工"来管理:入职、共享上下文、明确权限边界、行为可审计、可回放可追责。2026 年 2 月 5 日,OpenAI 正式发布了全新的人工智能平台 Frontier,旨在协助企业高效构建、部署并监督 AI 智能体。
Frontier 的设计思路与 OpenClaw 的极客路线截然相反——它与现有企业系统兼容,支持开放标准集成,不要求企业更换已有系统。更关键的是,Frontier 连接企业内部的数据仓库、CRM、工单工具和内部应用,构建一个所有 AI 同事都能引用的"企业语义层"。为推动落地,OpenAI 与 Accenture、BCG、Capgemini 和 McKinsey 结成了 Frontier Alliance,目标是到 2026 年底从企业部门获得 50% 的总收入。
这套打法的本质是:OpenClaw 证明了"能干活"的体验;Frontier 把"敢让它干活"变成企业可购买的能力。
路径二:中国云厂 ——"托管化的本地智能体"
中国围绕 OpenClaw 的反应速度令人印象深刻。阿里云轻量应用服务器在 1 月下旬就推出了部署 Clawdbot 的相关镜像,不仅预装运行环境,还集成了百炼大模型平台的 API 配置界面。1 月 28 日火山引擎宣布支持快速部署,1 月 30 日腾讯云上线应用模板,2 月 2 日百度智能云宣布一键部署服务。
一个乍看矛盾、实则极具中国特色的组合正在成型:名义上更本地(强调私有/自部署),交付上更云化(一键模板、托管、运维外包)。火山引擎专注确保 Agent"思考"时调用性价比最高的模型;阿里云和腾讯云则极速上线轻量应用服务器的一键部署镜像。两条路线的分歧实质上是:一条通向"极致的智力供给",另一条通向"全栈的应用托管"。
路径三:中国模型厂商 ——"品牌化 Claw 变体"大爆发
这是第 II 期和原始竞赛分析中尚未充分覆盖的维度。2026 年 2–3 月,中国主要模型厂商几乎不约而同地推出了基于 OpenClaw 生态的品牌化变体产品,形成了一个独特的"Claw 衍生品"赛道。
| 产品 | 厂商 | 核心策略 | 差异化亮点 |
|---|---|---|---|
| KimiClaw 云端原生 | 月之暗面 | 将 OpenClaw 原生集成至 kimi.com,浏览器标签页中直接运行,无需部署 | 40 GB 云端存储;K2.5 为官方推荐模型;iOS/Android 支持;¥199 起 |
| MaxClaw 专家集成 | MiniMax | 将 OpenClaw 与 Expert 专家智能体深度结合,内置 6 套子智能体 | 1.6 万+ 预置专家;事实核查子 Agent;飞书/钉钉/Telegram 多端协同 |
| AutoGLM 2.0 手机 Agent | 智谱 AI | 全球首个手机通用 Agent,云手机 + 云电脑范式,独立于 OpenClaw 框架 | 50+ 高频中文 App;纯视觉驱动 GUI;单次 Deep Research 仅 ¥1+;已开源 |
| 豆包手机助手 端侧内嵌 | 字节跳动 | UI-TARS 视觉驱动的 GUI Agent,内嵌于测试手机 | 纯视觉方案无需 API;端侧权限;跨应用合规挑战仍存 |
| LobsterAI 安全沙箱 | 网易有道 | 国产 OpenClaw 替代品,主打 GUI 友好和企业级安全 | QEMU + Alpine Linux 虚拟机隔离执行;本地 SQLite;不上云 |
| CoPaw 开源框架 | 阿里 | 对标 OpenClaw 的国产个人智能体框架,可端可云 | 优先支持钉钉/飞书/QQ;文件化记忆 + 主动心跳 |
KimiClaw 的定位最为激进——让普通用户无需本地安装或维护服务器,就能在云端获得一个 24×7 运行的 AI 助手。其策略的精明之处在于与 OpenClaw 的双向绑定:Kimi 官方围绕 OpenClaw 打造了 KimiClaw,把入口搬进浏览器;而 OpenClaw 也将 Kimi K2.5 划入"官方推荐"。这种正反馈飞轮效果显著——Kimi K2.5 的周 Token 使用量环比增长最高达 261%,其调用场景主要来自 OpenClaw。
MaxClaw 走了一条更"产品化"的路:一键打通 OpenClaw 生态,不需要繁琐的手动部署和配置模型 API。更独特的是它推出了 1.6 万个以上的专家智能体,并内置了事实核查子 Agent。MiniMax M2.5 模型也为 Agent 场景做了极致优化——从训练阶段就把 Agent 场景放在核心位置,通过自研 CISPO 算法,10B 激活参数跑出旗舰级成绩。
AutoGLM 则代表了一条完全不同的思路。智谱没有选择接入 OpenClaw 生态,而是走"手机 GUI Agent"路线,通过"云手机 + 云电脑"的形式,让 AI 真正能够"做"——操作美团、京东、小红书、抖音等数十个高频应用。智谱的判断是:既然 OpenClaw 证明了 Agent 的市场需求,那真正适合中国用户的 Agent,更应该是能操作微信、淘宝、抖音的 AutoGLM。
三、核心规格之争:硅谷与中国在比什么
透过产品表象,我们可以从五个维度剖析这场竞赛的深层分歧。
| 维度 | 硅谷路线 | 中国路线 | 判断 |
|---|---|---|---|
| 执行与权限 | 权限 = 企业可管理资产:最小权限、审批边界、审计日志、策略治理 | 权限 = 默认合规模板:面向组织的身份/访问控制,强调基线配置 | 企业深水区硅谷更强;大规模普及看谁把"默认安全"做得更无感 |
| 生态与分发 | 开发者生态 + 企业集成伙伴(四大咨询推动生产化) | 云市场/一键部署/托管;企业 IM(钉钉/飞书/企微)为分发入口 | 铺量中国更凶猛;高端客单硅谷更稳 |
| 技能/插件 | 开放注册表 → 爆炸式扩张 + 供应链风险(ClawHavoc 事件) | 插件与渠道打包在云模板中,对权限范围做更强约束 | "开放"赢速度,"治理"赢寿命;终将合流为"可验证的开放" |
| 安全响应 | 社区补丁 + 平台规则加码 = "自律安全带" | 监管直接提示风险 + 推动组织级防护 = "强制刹车系统" | 中国前置安全;硅谷后置修复 |
| 商业模式 | 控制平面(Frontier)= 新一代企业软件层,卖"组织能力" | 云租赁与托管 = 新型算力房租,卖"运行便利" | 硅谷卖治理溢价;中国卖规模效应;护城河不同 |
分歧一:入口之争的维度差异
硅谷的入口争夺围绕"终端 vs 桌面 vs 浏览器"展开。中国则是三维博弈:智谱认为真正适合中国用户的 Agent 应该能操作微信、淘宝、抖音——这些 OpenClaw 桌面端根本触及不到的超级应用。国内 AI 的逻辑更接近"模型即服务",更愿意抓住任何机会进入用户工作流。与此同时,字节跳动对 Agent 的注意力集中在移动端,因为豆包手机助手通过 UI-TARS 纯视觉驱动的方案,在移动场景下比 OpenClaw 更有优势。
分歧二:Token 经济学 ——"卖铲人"的春季大乱斗
第 II 期报告中我们推导了 Token 成本公式。在实际市场中,这一公式的影响已剧烈传导至资本市场:由于 Agent 运行需要大量 Token,API 调用量指数级飙升。作为"卖铲人",智谱、MiniMax、Kimi、阿里云等纷纷推出 Coding Plan 的 API 套餐。智谱与 MiniMax 在港股市值双双突破三千亿港元;未上市的 Kimi 则以破百亿美元估值,刷新了国内大模型独角兽的纪录。
但"卖铲人"的狂欢背后隐藏着结构性风险——这套系统的开发壁垒其实不高,本质只是一个连接提示词、大模型接口和操作系统命令行的中间件。各大厂已敏锐地察觉到:未来 AI 竞争的终局不在于谁的 API 单价低,而在于谁能最深地扎根于用户的本地工作流中。
这一判断与第 II 期报告中 pi 引擎的 ToolMaker 模式高度呼应——当 AI 能够自我生成工具时,硬编码的工具(和背后的工具提供商)将面临边际价值归零的命运。OpenClaw 的火爆标志着 AI 云的竞争高点,正从"资源层"和"模型层"向"工作流层"(Workflow as a Service)迁移。
分歧三:安全 ——"安全噩梦"与"前置刹车"
安全问题是 OpenClaw 竞赛中最触目惊心的维度。ClawHub 市场共发现 1,184 个恶意技能,这些技能会窃取 SSH 密钥、加密钱包、浏览器密码并打开反向 Shell——仅一名攻击者就上传了 677 个软件包。与此同时,15,200 个 OpenClaw 控制面板暴露于公网,核心问题源于默认配置绑定到 0.0.0.0:18789 监听所有网络接口。更严重的是,CVE-2026-25253 实现了一键远程代码执行——攻击者可远程控制 OpenClaw 实例,进而控制用户电脑。连 Meta 自己都在事件后禁止员工在公司设备上使用 OpenClaw。
面对这种"安全噩梦",中美走出了截然不同的应对路线。硅谷倾向于社区自修复——OpenClaw 官方与 VirusTotal 达成合作,对超过 3,016 个 Skills 样本进行自动化安全分析。中国方面则更倾向于前置安全设计——网易有道的 LobsterAI 支持 QEMU 虚拟机隔离,MaxClaw 完全托管在云端免除本地权限风险,智谱的 AutoGLM 通过云手机将敏感操作隔离在虚拟设备中。
四、三条路径的深层逻辑
硅谷:从"极客玩具"到"企业神经系统"
OpenClaw 创始人 Steinberger 于 2 月 14 日宣布加入 OpenAI,使命是"打造一个连我妈妈都会用的智能体"。OpenAI 随即在 2 月 5 日发布了 Frontier 平台。这些动作旨在部署 OpenAI 的新 Frontier 企业平台——一个编排层,目的是将企业从实验性 AI 试点过渡到完全自主的 Agentic 运营。
Frontier 的战略意义远不止于产品本身。通过嵌入四大咨询公司的全球交付网络,OpenAI 实际上创造了一条阻止竞争对手轻易替换其技术的护城河。Forrester 分析师指出:"对 OpenAI 来说,不借助咨询公司独立完成这件事将是一个艰难且耗时的过程。这是在全球大型企业中推广 Frontier 平台的正确选择。"
中国云厂:把"极客项目"翻译成"云产品 SKU"
阿里云不仅提供了服务器镜像,还在镜像中深度集成了自家的"百炼"平台和通义千问模型,甚至可以直接跟钉钉集成。这种"全栈式"打法的本质是将用户锁定在自己的生态闭环中。云厂商的入局不仅简化了部署流程,也改变了 OpenClaw 的使用模式——原本许多用户倾向于本地部署,但现在可以选择云服务器实现 7×24 小时不间断运行。
中国模型厂商:抢占"Agent 原住民"的心智入口
这是最具中国特色的路径。月之暗面推出了云端版 KimiClaw,MiniMax 紧随其后发布了 MaxClaw——道理很简单,本土化的 OpenClaw 仍然是市场的一大空缺。但各家的战略选择反映了截然不同的赌注:Kimi 赌"API 调用飞轮",MiniMax 赌"专家 Agent 平台",智谱赌"手机 GUI Agent",字节赌"端侧内嵌"。
到 2026 年,AI Agent 的竞争核心从技术研发变成了场景落地。而最懂场景的,永远是身处其中的业务人。这解释了为什么 MaxClaw 要内置 1.6 万个专家智能体,为什么 AutoGLM 要覆盖 50+ 高频中文应用——在中国市场,场景密度而非模型参数才是终极竞争力。
五、从 pi 引擎延伸:成熟度模型的扩展
第 II 期报告提出的 AI 编程成熟度模型(T1—T4),在更广阔的智能体竞赛中得到了验证和扩展。我们将其升级为"智能体成熟度模型":
| 级别 | 代表 | 核心特征 | 信任层级 |
|---|---|---|---|
| T1: 对话助手 | ChatGPT (2023) | 你问我答,无执行能力 | 无需信任——它不会干活 |
| T2: 多工具编辑 | Claude Code 8 工具 | 硬编码工具集,容易选错/正则崩溃 | 低信任——经常出错 |
| T3: 自我造物 | OpenClaw pi 引擎 4 工具 | ToolMaker 自生成临时脚本,AST 级重构 | 中信任——能力强但安全弱 |
| T4: 企业级可控 | Frontier · MaxClaw | 权限治理 + 审计 + 可验证生态 | 高信任——"敢让它干活" |
| T5: 自主操作系统 | AutoGLM 2.0 · 未来 | 跨设备、跨应用自主执行,全域连接 | 极高信任——需要新社会契约 |
pi 引擎的 ToolMaker 理念——"不要给 AI 扳手,给它车床让它自己造扳手"——正在被各家以不同形式吸收。MaxClaw 内置的专家智能体本质上是"预制的 ToolMaker 产物";AutoGLM 的端到端强化学习框架则在操作系统层面实现了更深层的"自我造物"。但核心悖论依然存在:能力越强,安全边界的定义就越难。
六、时间线:龙虾的三个月
七、关键洞察:综合三期报告的终极判断
洞察一:模型在下沉,信任在上升
正如第 II 期报告揭示的,pi 引擎证明了当模型智力突破临界点时,做减法才是正确路径。当各家模型都足够强,差异从"智商"转移到"品控":权限、审计、供应链安全、默认配置、失败回滚。恶意技能事件、15,200 个暴露面板和 Meta 禁令——把这个趋势提前写在了墙上。"能不能做"不再稀缺,"能不能放心让它做"才稀缺——正在成为全行业共识。
洞察二:开放生态必须配"可验证性"
ClawHub 上 5,700+ 技能中有 1,184 个被确认为恶意(污染率约 20%),这使得"可验证的开放"成为下一代智能体标准。不是"开不开源",而是"能不能验证":来源、签名、权限声明、行为沙箱、可观测与可追责。第 II 期报告中 Executor 的沙箱设计是正确方向,但还远远不够。
洞察三:分发入口的三维博弈
硅谷的入口争夺是二维的(终端 vs 桌面 vs 浏览器)。中国则是三维博弈:手机厂商(AutoGLM/豆包)掌握 OS 级权限;互联网巨头(钉钉/飞书/企微)掌握通信入口;模型厂商(KimiClaw/MaxClaw)试图通过 API 黏性绑定开发者。谁能同时拥有"信任 + 分发",谁就会把别人变成插件。
洞察四:Token 经济学将重塑产业结构
OpenClaw 是"Token 熔炉":第 II 期推导的成本公式 C = Σ(Tin×Pin + Tout×Pout)×(1+ε)i 已在市场得到验证。中国暂时用低价 API 掩盖了架构低效,但各大厂已察觉"纯卖 Token"不是终局。从"云端卖水"到"本地造城"的暗战已拉开帷幕——能存活的将是在架构层面实现智能路由和上下文压缩的产品。
洞察五:商业模式在分裂,也在合流
短期看:硅谷卖控制平面(Frontier),中国卖托管与算力房租,模型厂商卖品牌化 Claw 变体。中期看:三者会互相吞并对方的特性——托管变得更可治理,控制平面变得更"开箱即用",Claw 变体向平台化演进。最后留下的,像一个新物种:Agent OS + 控制平面 + 可验证生态。
洞察六(本期新增):手机 Agent 是被低估的终极武器
当 OpenClaw 社区还在讨论如何用 Mac Mini 跑 Agent 时,智谱 AutoGLM 2.0 已经能在 50+ 高频中国应用中自主操作——点外卖、订机票、发小红书。它不需要 Node.js,不需要 API Key,不需要理解什么是 Gateway。更重要的是,AutoGLM 单次 Deep Research 成本仅约 ¥1——是 Claude API 的 1/30。中国手机 Agent 可能在无意中率先抵达了消费级 Agent 的终点。
八、战略结论:如何判断"谁在赢"
别盯着模型排名和 GitHub 星标。盯这三条指标:
单位任务的可审计性 —— 一次任务是否能解释、回放、追责。Frontier 在此维度遥遥领先;中国厂商正在补课。
单位扩展的可验证性 —— 一个新技能接入的成本是"点一下"还是"做审计"。ClawHavoc 事件证明了纯开放注册表的脆弱性;MaxClaw 的内置工具策略和 LobsterAI 的虚拟机隔离代表了两种可能的解法。
单位交付的摩擦 —— 部署/运维/升级是否被云模板吞掉。KimiClaw 的"浏览器标签页即 Agent"和 AutoGLM 的"下载 App 即可用",正在将摩擦逼近于零。
终极判断:硅谷在争"企业大脑的神经系统",中国在争"智能体的电力公司与高速公路"。谁能同时拥有"信任 + 分发",谁就会把别人变成插件。而在中国市场的特殊语境下,掌握系统级权限的手机 Agent(AutoGLM、豆包)与掌握通信入口的超级应用(钉钉、飞书、微信),可能比任何开源框架都更有机会成为那个"把别人变成插件"的人。
这场由一只开源龙虾引发的全球竞赛,才刚刚进入真正的淘汰赛阶段。■
研究方法与信源:本报告为内参系列第 III 期,综合了第 I 期(Palantir 本体论)和第 II 期(pi 引擎拆解)的分析框架,引用信源包括:OpenAI 官方(Frontier / Alliance)、GitHub、36氪、界面新闻、DoNews、爱范儿、极客公园、量子位、DataLearner、知乎、CSDN、绿盟科技、慢雾安全、Koi Security、Censys STRIKE、The Register、InfoQ、Fortune、Reuters、21世纪经济报道等。所有数据截至 2026 年 3 月 3 日。
[S1] OpenClaw GitHub · [S2] Censys 暴露面 · [S3] Tom's Hardware / Koi Security 恶意技能 · [S4] The Verge Skills 安全 · [S5] Reuters 中国监管提示 · [S6–S8] OpenAI Frontier / Alliance · [S9] 阿里云部署 · [S10] 腾讯云 Lighthouse · [S11] The Register 云厂商观察 · [S12] WSJ / Fortune 媒体报道
课后巩固
与本文内容匹配的闪卡与测验,帮助巩固所学知识
延伸阅读
根据本文主题,为你推荐相关的学习资料