智能体平台调研与复刻方案(整合版)

Genspark / Lovart / Manus + Claude Agent SDK / Skills / Workflow · 生成时间:2025-12-28 13:44
离线 HTML · 可打印/可收藏 打印 / 导出 PDF 切换浅色/深色

目的与范围

本 HTML 将此前的调研与复刻方案完整整合为一个可离线保存的文档,目标是:复刻并超越 Genspark / Lovart / Manus 这类智能体平台的关键能力,并采用你指定的技术路线:Claude Agent SDK + Skills + Workflow

交付物中心(Page/Canvas/Run) 可观测工作流(可回放/可审计) 工具链治理(MCP + 权限/审批) 多语言 + 多模型路由 订阅 + Credits 混合付费墙
注意:产品价格、计划名称、模型列表等可能随时间变化,最终以官方页面为准。本报告用于架构与产品复刻参考,不作为投资/财务建议。

三种“Agent 产品形态”总结

你要复刻的不是一个 UI,而是三类交付形态(产品底层能力不同,界面也必须随之变化):

平台 核心交付物形态 关键体验 你复刻时的抓手
Genspark 可发布/可分享的结构化页面(Sparkpages)+ 一体化工作区 “一个工作台做完所有事”+ 多模型聚合 Page Workspace + 多模型入口 + Team/Connector 管理
Lovart 无限画布上的可编辑多模态资产(图/视频/3D/品牌套件) “说/点/调”三层交互 + 批量修改 Canvas Workspace(选区批注、图层、Inspector、导出)
Manus 执行型项目(Run):像“虚拟同事”一样规划、执行、交付 异步执行 + 可回放过程 + 并行 Wide Research Run Workspace + 多子任务编排 + Map-Reduce 并行

复刻方向(产品层)

把平台做成「交付物中心」,避免只做一个“大聊天框”。

四个 Workspaces:Chat / Page / Canvas / Run。

复刻方向(技术层)

用 Claude Agent SDK 做执行层,用 Skills 做能力复用,用 Workflow 做可控编排。

控制面 / 数据面分离(Control Plane / Data Plane)。

平台拆解:Genspark / Lovart / Manus

Genspark:多模型聚合 + Team 治理 + 低门槛“无限聊天/出图”

核心定位:All‑in‑One Super Agent AI Workspace(多入口工作台),突出“AI Chat/AI Image 不耗 credits”的卖点,并提供 Team Plan 管理(角色、用量、SSO/SAML、connector 管理等)。

可复刻点

  • 一体化入口:左侧导航的“任务类型入口”(Chat/Docs/Slides/Sheets/Drive/Research 等)。
  • 混合计费墙:订阅 seat credits/月 + 核心入口(聊天、图片)零 credits 的“心理定价”。
  • 团队治理:用量分析、成员角色、单点登录、连接器管理(企业最看重)。

参考链接

Lovart:Design Agent + 无限画布 + 多模态资产流水线

核心定位:“世界首个设计 Agent”,强调一张无限画布完成:概念 → 视觉 → 资产组合 → 导出交付。

可复刻点

  • 交互范式:对话层(需求)+ 画布选区(指哪改哪)+ Inspector(参数化可控)。
  • 批量修改:批注队列 + 一键 Run All(大幅提升效率)。
  • 透明成本提示:生成前显示 credits 消耗(降低“被扣费”心理落差)。

参考链接

Manus:执行型 Agent(虚拟同事)+ 并行 Wide Research + API

核心定位:不是聊天机器人,而是能规划与执行行动的通用 Agent,强调异步执行、可回放过程、以及面向批处理的 Wide Research。

可复刻点

  • Run Workspace:左侧计划/对话/工具轨迹,右侧“电脑/文件/终端/网页快照”。
  • Wide Research:对 100 个 item 不串行跑,而是“数百独立 agent 并行”。
  • API:将“完整 agent”嵌入业务系统:触发任务、上传附件、webhook 回调结果。

参考链接

统一产品蓝图:一个平台兼容三种形态

把三者整合成一个产品,你要从“聊天”升级为交付物中心。建议信息架构如下:

Workspace 定位 典型交付物 关键组件
Chat 低门槛入口(第一次体验) 快速问答、轻量改写 消息流、工具卡片、模型切换、引用
Page 研究/写作的结构化页面交付 Sparkpage、竞品报告、研究简报 大纲、引用抽屉、发布/导出、Copilot 面板
Canvas 创意/设计的可编辑画布交付 海报、品牌套件、封面、分镜 无限画布、图层、Inspector、批注队列、批量执行
Run 执行型项目(自动化/代码/电脑) 脚本、网站项目、数据分析、自动化流程 计划/子任务、工具轨迹、电脑视图、Checkpoints、产物库
关键理念:“交付物”是第一公民(First‑class)。对话是过程、页面/画布/项目才是成果。

能力中心(Hubs)

Skills 市场:可复用专业能力包(品牌规范、数据分析、投研、SEO、法务审查…)

Workflow Builder:把“可复用流程”产品化(模板、版本、可回放)。

平台护城河

不是“哪家模型更强”,而是:工具链治理 + 工作流可控 + 交付物体验 + 团队协作

这四点组合才构成长期优势。

采用 Claude Agent SDK + Skills + Workflow 的系统架构

核心概念(Tool / Skill / Workflow / Agent)

  • Tool:原子能力(查 DB / 发邮件 / 运行命令 / 读写文件 / 生成图片等)。
  • Skill:面向 Claude 的可复用能力包(以 SKILL.md 为核心),由模型自主判断何时调用。
  • Workflow:显式步骤编排(DAG/状态机),强调可观测、可重试、可控成本。
  • Agent:运行时实体,使用 Agent SDK 的 agent loop 来规划/调用工具/生成结果。
来源:Claude Agent SDK 官方文档说明 SDK 提供 agent loop、工具、上下文管理,并支持 Python/TypeScript。
参考:Agent SDK overviewAgent Skills in the SDK

总体架构:Control Plane / Data Plane 分离

控制面(Control Plane):产品与治理(鉴权、组织、计费、技能/工作流注册、审计与可观测)。
数据面(Data Plane):执行与算力(Agent 运行时、workflow workers、工具/MCP hub、产物存储)。

复制
[Web/Mobile UI]  --(WS/SSE streaming)-->  [API Gateway]
   |                                           |
   |                                           +--> Auth & Org (RBAC/SSO)
   |                                           +--> Billing & Metering (credits, quotas)
   |                                           +--> Skill Registry / Workflow Registry
   |
   +--> [Workflow Service] --dispatch--> [Queue] --> [Workflow Workers]
                                              |
                                              +--> [Agent Runtime Pool] (Claude Agent SDK)
                                              |        |
                                              |        +--> [Tool/MCP Hub] --> SaaS/DB/Browser/VM
                                              |
                                              +--> [Artifact Store] (pages, files, images, video)
          

Agent Runtime:做出 Manus-like 的“执行层”

  • 隔离沙箱:每个 Run 在容器/VM 中执行,避免工具调用造成越权风险。
  • Session 可恢复:支持暂停/继续/分叉(Fork),让长任务具备可控性与容错。
  • 工具审批:对写入/外部通信/高风险动作弹窗审批(一次/本次/总是允许)。
工程建议:把“审批”做成一等公民
  • 工具分级:Read‑only / Write / External / Payment / Admin。
  • Workflow 节点可声明 required approvals:未批准则进入 Human Step。
  • UI 设计:审批卡片展示「将要做什么」「影响范围」「消耗 credits 预估」「可回滚吗」。

Skills 平台化:Registry + Mount(装配层)

官方 Skills 在 SDK 中以文件结构存在(.claude/skills/<skill>/SKILL.md),因此平台要做“装配层”:Run 启动前把选定 skills 编译并挂载到运行时目录。

参考:Agent Skills in the SDK, 以及 TypeScript SDK repo:anthropics/claude-agent-sdk-typescript

Workflow:把复刻能力做成可控、可复用的“产品”

Workflow 的核心是:把“Agent 能做什么”变成可编排、可观测、可审计的流程模板。

推荐的 Workflow 节点类型(最重要)
  • Agent Step:调用 Agent SDK(带上下文与工具权限)。
  • Tool Step:确定性工具调用(MCP / 内部 API)。
  • Skill Step:启用 Skill tool,让模型自主触发技能。
  • Subagent Step:并行子 agent,用于批处理/评审/对照。
  • Human Step:人工审批/补充信息(合规、付款、发信等)。
  • Artifact Step:导出交付物(Page/Canvas assets/ZIP 项目)。
复刻 Manus Wide Research 的通用模板:Map‑Reduce Agent

Manus Wide Research 的官方描述是:对 100 个 item 不用一个 agent 串行跑,而是部署数百独立 agent 并行,每个 agent 拿到独立上下文处理一个 item。

你可以用 Workflow+Subagents 复刻:

  • Map:Haiku/Sonnet 子 agent 并发处理 items(抽取/分类/评估)。
  • Reduce:主 agent 汇总去重、生成结构化表格/报告。
  • Verify:对关键输出加验收节点(格式/引用/事实/敏感)。

参考:Manus Wide Research(官方文档)

工具链:MCP + 连接器治理

建议把 MCP 作为工具协议主干,统一管理第三方连接器(Google Drive/Notion/Slack/DB/内部系统),在 Tool Hub 里实现 OAuth token vault、租户隔离、白名单与配额。

模型选型、路由与多语言策略

模型路由(Model Router)建议

建议在平台层实现 model router(按场景自动选模型),并在 UI 保留手动切换:

  • 默认:Claude Sonnet(综合平衡)
  • 批处理/并行子任务:Claude Haiku(更快更省)
  • 高价值交付/审校:Claude Opus(作为 Pro/Enterprise 权益)
参考:Claude Agent SDK 官方文档与工程文章(如何构建 agent 的最佳实践)。
Agent SDK overview · Building agents with the Claude Agent SDK

多语言支持策略(产品 + 内容)

  • UI 多语言:标准 i18n(key-value 文案)+ RTL 适配(如阿拉伯语)。
  • 内容多语言:把“工作语言”与“交付语言”分离:内部规划可用英文更稳定,最终输出再转目标语言。
  • 检索跨语言:在 Research 类 workflow 中,默认同时检索中/英来源,汇总后再按用户语言输出。

成本优化(必须内建)

  • Prompt Caching:将稳定的 system/skills/工具描述放在可缓存部分,降低重复成本。
  • Batch:对离线/批处理任务走批处理通道(如 nightly 批量生成报告)。
  • 用量看板:为用户与管理员提供 token、工具调用次数、存储占用、并发使用等统计。

深度优化清单(在 Claude SDK / Skills / Workflow 上“超车”)

1) PEV:Planner / Executor / Verifier 三段式

把 agent loop 工程化,显著提升可靠性与可控性:

  • Planner:输出结构化计划(步骤、依赖、风险点、成本预估、需要审批的信息)。
  • Executor:只做动作(少解释,省 token),工具调用严格 schema。
  • Verifier:自动验收(格式、引用、数据校验、敏感/合规、品牌规范)。

2) 大规模任务:Map‑Reduce Subagents(复刻 Wide Research)

把“批处理能力”做成平台差异化功能(比单 agent 串行快一个数量级)。

3) 记忆与可回滚:项目 CLAUDE.md + compaction + checkpoint

  • 每个 Project 维护长期规范(品牌/写作/命名/导出规格)。
  • 长任务自动摘要压缩上下文(compaction),减少上下文漂移。
  • 关键步骤打 checkpoint,支持回滚与 diff(尤其 Canvas/代码项目)。

4) 结构化输出:让“交付物”始终可渲染

  • 所有 Workflow 节点输出走 JSON Schema(失败自动修复或重试)。
  • Page/Canvas 的核心 DSL(页面结构/画布节点树)强制校验,避免布局崩坏。

5) 端到端延迟:Streaming + 子任务模型分层

  • Run Workspace 全链路 SSE/WS streaming;UI 先显示计划与进度,再渐进补全结果。
  • 子任务优先用更快模型(Haiku),最终汇总用更强模型(Sonnet/Opus)。

6) 付费墙深化:把 credits 从“token”升级为“资源点数”

建议将 credits 拆成 5 个成本维度,再在前端折叠成一个“点数”让用户易理解:

  1. LLM tokens(按模型费率换算)
  2. Tool 调用成本(搜索、抓取、第三方 API)
  3. 计算资源(代码执行、视频渲染、大图生成)
  4. 存储与带宽(Drive、导出、分享页面)
  5. 并发额度(Wide Research 并行 agent 数)

前端风格与交互:组件参考清单(Design System 级)

全局壳(所有 Workspace 通用)

  • App Shell:Left Sidebar(Workspaces/Projects/Templates/Skills)+ Top Bar(模型、语言、credits、状态)
  • Command Palette(⌘K):搜索 Skills/Workflows/Artifacts/Run 历史
  • 身份与组织:Workspace Switcher(个人/团队/组织),Role Badge,Connector Manager

Chat Workspace(低门槛入口)

  • Message List(支持引用/附件/表格渲染)
  • Tool Call Card(工具名、参数、耗时、输出摘要、可重试)
  • Approval Modal(写入/外部动作审批)
  • Model Picker(Sonnet/Haiku/Opus + 快速/深思模式)

Page Workspace(Genspark-like)

  • Page Outline(自动 TOC)
  • Citation Drawer(来源引用抽屉)
  • Copilot Side Panel(对页面继续问答/改写/扩写)
  • Export(PDF/Doc/Markdown/Notion)+ Publish(权限:public/private/org)

Canvas Workspace(Lovart-like)

  • Infinite Canvas(Pan/Zoom)
  • Layer Panel(组/锁定/可见/图层命名)
  • Inspector(Typography/Color/Grid/Spacing/Effects/Brand rules)
  • Asset Tray(生成历史、变体、素材库)
  • 批注队列 + Run All(批量应用修改)

Run Workspace(Manus-like)

  • Split View:左(对话/计划/工具轨迹)+ 右(电脑/文件树/编辑器/终端/网页快照)
  • Todo Timeline(可折叠子任务)
  • Checkpoints(回滚点、diff 查看)
  • Artifact Gallery(产物卡片:报告/表格/代码仓库/图片/视频)
  • Resume/Fork(继续/分叉运行)

MVP 切分建议(先上线最关键能力)

不报时间,只给顺序(每一步都可单独上线形成价值):

  1. Phase A:Run(执行层)优先 — Agent Runtime + Tool trace + Approval + Artifact store + 并行 subagents
  2. Phase B:Page(研究交付) — 结构化页面生成 + 引用 + 发布/导出
  3. Phase C:Canvas(创意交付) — 无限画布 + 图层 + Inspector + 批量改动 + 多格式导出
  4. Phase D:平台化 — Skill Registry + Workflow Builder + Team/Org + SSO/Connector/审计

参考链接(官方/一手资料优先)