产品需求文档 (PRD):下一代智能体编排与生成式交互引擎

1. 主题

Next-Gen Agent Orchestration & Generative UI (SOTA Upgrade) 打造基于 LangGraph 的图式编排引擎与基于 Vercel AI SDK 的生成式用户界面,实现业财税合规场景下的深度推理与极致交互。

2. 简介

本产品升级旨在将现有的线性对话平台转型为真正的“智能体操作系统”。通过引入 LangGraph,我们将支持循环、分支和持久化状态的复杂工作流,满足税务审计、合规检查等长程任务需求。同时,通过 Generative UI,我们将对话框升级为动态交互界面,让数据分析、报表生成等任务实现“所见即所得”。

3. 问题陈述

  • 复杂逻辑受限:当前的线性 Chain 架构难以处理需要反复修正(Loop)或多路径决策(Branching)的复杂合规流程。
  • 交互单一:用户仅能通过文本获取信息,面对复杂的财务报表或税务数据,纯文本输出效率低下且难以二次编辑。
  • 状态丢失:缺乏持久化的状态管理,长流程任务一旦中断(如等待人工审批),上下文容易丢失。

4. 目标与目的

  • 构建图式大脑:实现基于 LangGraph 的后端编排,支持 Cyclic Graph(循环图)结构。
  • 实现生成式 UI:前端集成 Vercel AI SDK,支持 Server-side Tool Calling 渲染 React 组件。
  • 增强人工介入:在自动化流程中无缝嵌入 Human-in-the-loop 审批节点。
  • 提升开发效率:通过 MCP 协议标准化工具调用,降低 50% 的集成成本。

5. 用户故事

  • 作为税务合规官,我希望系统能自动检查发票,发现问题后自动尝试修正,修正失败再转给我审批,而不是直接报错停止。
  • 作为财务经理,当我询问“上季度利润趋势”时,我希望直接看到一个可交互的折线图和数据表格,而不是一段文字描述。
  • 作为开发者,我希望通过简单的 JSON 配置就能定义一个包含“检索-思考-行动-验证”循环的 Agent,而不需要写大量胶水代码。

6. 技术要求

  • 后端 (Python/FastAPI)
    • 引入 langgraph 库,重构 AgentService
    • 实现 StateGraph 定义,包含 nodes (节点) 和 edges (边)。
    • 集成 Postgres 作为 Checkpointer,持久化保存 Agent 运行状态。
  • 前端 (Next.js/React)
    • 集成 ai/rsc (React Server Components)。
    • 实现 streamUI 接口,支持流式渲染组件(如 <FinancialChart />, <ComplianceTable />)。
    • 升级 useChat hook 以支持复杂的工具调用反馈。
  • 协议 (MCP)
    • 确保所有 Tool 定义符合 Model Context Protocol 标准。

7. 收益

  • 任务成功率提升:通过自我修正机制(Self-Correction),复杂任务成功率预计提升 40%。
  • 用户效率提升:生成式 UI 减少了用户“阅读文本->手动制表”的时间,决策效率提升 60%。
  • 合规性增强:强制的人工审批节点确保了关键决策的合规性。

8. KPI 指标

  • 复杂任务完成率:多步推理任务的成功执行比例。
  • 人工介入响应时间:用户处理审批请求的平均时间。
  • 组件交互频次:用户与生成式 UI 组件(图表、表格)的交互次数。

9. 开发风险

  • 学习曲线:LangGraph 的图论概念对团队有一定学习门槛。
  • 流式传输稳定性:生成式 UI 依赖稳定的流式传输,网络波动可能导致组件渲染不完整。
  • 状态管理开销:持久化所有中间状态可能增加数据库存储压力。

10. 结论

本次升级是平台迈向“企业级智能体 OS”的关键一步。通过图式编排和生成式 UI,我们不仅解决了当前的技术瓶颈,更为未来的自动化业务流打下了坚实基础。这不仅是一次技术重构,更是产品形态的质变。