MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照
原创
灵阙教研团队
S 精选 进阶 |
约 3 分钟阅读
更新于 2026-01-10 AI 导读
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版 MODEL_ROUTING_ARCHITECTURE.md 与当前真实代码链路,突出关键差异与影响。 1. 结论摘要 现行系统仍是 双栈路由(Backend 与 Web 分离),但基础规则已抽至共享内核...
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照
版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版
MODEL_ROUTING_ARCHITECTURE.md与当前真实代码链路,突出关键差异与影响。
1. 结论摘要
- 现行系统仍是 双栈路由(Backend 与 Web 分离),但基础规则已抽至共享内核
model-router-core。 - Zenmux 在 Backend 路由链中 未出现;Web 路由链中仅部分 family 使用。
- Web 引入 任务路由(Task Router) 与 服务级 fallback,旧文档未覆盖。
- PPT 图片链路已 收敛:Google 仅
gemini-3-pro-image-preview,Poe 仅nano-banana-pro。 - 旧文档的“统一质量档位/场景配置”与现行代码实现 不一致(Web 有场景配置,Backend 用 env 默认)。
2. 差异对照表(关键路径)
| 维度 | 旧文档(计划) | 现行代码(现实) | 影响 |
|---|---|---|---|
| 路由架构 | 单一 SmartRouter 统一入口 | Backend (src/llm/*) + Web (apps/web/lib/llm/*) 双栈 |
同名模型在不同路径下 fallback 不一致 |
| 路由内核 | 未拆分 | src/llm/shared/model-router-core.ts 统一 family/transform/env |
基础规则统一但链路仍分离 |
| Zenmux | 多数 family 进入 fallback | Backend 不在 fallback;Web 仅 gpt/other 部分出现 | “配置里有 Zenmux”≠“实际会走” |
| SiliconFlow | 作为聚合/加速分支 | Web deepseek/glm/kimi/qwen/llama/mistral/other 引入;Backend 未引入 | 国内加速仅 Web 路由侧生效 |
| Gemini fallback | Google → Poe → OpenRouter | Backend/Web 一致 | 与旧文档一致 |
| GPT fallback | Poe → OpenRouter → Zenmux → OpenAI | Backend: Poe → OpenRouter → OpenAI;Web: Poe → OpenRouter → Zenmux → OpenAI | Backend 缺少 Zenmux |
| DeepSeek fallback | Poe → Zenmux → OpenRouter → DeepSeek | Backend: Poe → OpenRouter → DeepSeek;Web: Poe → SiliconFlow → OpenRouter → DeepSeek | 现实路径差异明显 |
| 任务路由 | 未提及 Task Router | Web 有 task-model-router + SmartChat 动态路由 |
实际调用更依赖 TaskType 选择 |
| 文本服务 fallback | 统一按 SmartRouter | Web 多个 API 显式 try/catch fallback | 服务级 fallback 与路由层并存 |
| PPT 图片链路 | Google: Pro → Flash;Poe: 多模型链 | Google: 仅 Pro;Poe: 仅 nano-banana-pro | PPT 文生图链路更短、更确定 |
| 质量档位 | Premium/Balanced/Fast 三档 | Backend 用 env 默认;Web 有场景配置但不等同路由 | 质量档位未统一执行 |
| Google Key | Ai-studio-jason 单账号 | Web GOOGLE_API_KEYS 单条 entry,轮询逻辑保留 |
与旧文档一致(数量为 1) |
3. 现行链路摘要(用于快速核对)
Backend:
src/llm/model-router.ts- gpt: poe → openrouter → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → openrouter → deepseek
- glm: poe → openrouter
- kimi: poe → openrouter
- qwen: poe → openrouter
- llama: poe → openrouter
- mistral: poe → openrouter
- other: poe → openrouter
- 注: 实际可用链路会过滤未配置 Key 与非支持 provider
Web:
apps/web/lib/llm/model-router.ts- gpt: poe → openrouter → zenmux → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → siliconflow → openrouter → deepseek
- glm: siliconflow → poe → openrouter → zhipu
- kimi: siliconflow → poe → openrouter → kimi
- qwen: siliconflow → poe → openrouter → alibaba
- llama/mistral: poe → openrouter → siliconflow
- other: poe → openrouter → siliconflow → zenmux
PPT 图片:
apps/web/lib/services/image-generation.ts- PPT 场景:Google
gemini-3-pro-image-previewonly → Poenano-banana-proonly
- PPT 场景:Google
更多细节见 docs/MODEL_ROUTING_ARCHITECTURE_CURRENT.md。
4. 证据索引(代码来源)
src/llm/model-router.tssrc/llm/shared/model-router-core.tssrc/llm/smart-router.tssrc/config/models.tsapps/web/lib/llm/model-router.tsapps/web/lib/llm/smart-router.tsapps/web/lib/llm/task-model-router.tsapps/web/app/api/ai/smart-chat/route.tsapps/web/lib/services/image-generation.tsapps/web/app/api/services/generate-ppt/route.tsapps/web/app/api/services/slide-ai-assist/route.tsapps/web/app/api/services/ai-text-enhance/route.tsapps/web/app/api/services/ai-polish/route.tsapps/web/app/api/services/sheet-process/route.ts
猪哥云(四川)网络科技有限公司 | 合规网 www.hegui.com 猪哥云-数据产品部-Maurice | maurice_wen@proton.me 2025 猪哥云-灵阙企业级智能体平台