Medeo.app 工程实现方法拆解（续篇 2–6 完整整合版）

原创灵阙教研团队

A 推荐进阶 | 约 31 分钟阅读更新于 2026-01-05

AI 导读

Medeo.app 工程实现方法拆解（续篇 2–6 完整整合版）整合内容覆盖：Recipe/DAG、Planner/Locator、渲染与缓存、计费与运营、企业/API、质量门槛、Op 指令集、A/B 与个性化等（章节 11–52 + 附录 2–7）。工程化：Patch/DSL 体验：渐进式交付成本：segment cache 稳定：可回放/可回归商业化：审计/配额目录（11–20）...

目录（11–20）

Recipe、路由降级、协作、缓存、音频字幕、API、测试、安全、成本

11 Recipe 系统
12 模型路由与降级
13 协作与多人编辑
14 存储与缓存
15 音频链路
16 字幕系统
17 API / BFF
18 测试与评估
19 安全与合规
20 基础设施与成本
附录：事件溯源

目录（21–27）

Planner/Locator、风格系统、Prompt 工程化、治理策略、增长飞轮、模块蓝图

21 Planner
22 Locator
23 风格系统
24 Prompt / Tooling
25 内容治理与策略
26 增长飞轮
27 全链路蓝图
附录：失败模式与防护

目录（28–34）

索引检索、B-roll、节奏、多比例、编辑器一致性、性能体验、对话 UX

28 索引与检索
29 B-roll 选择引擎
30 节奏引擎
31 多比例导出
32 编辑器实现
33 性能与体验
34 对话式编辑 UX 回路
附录：最小 Worker 与契约

目录（35–41）

供应商抽象、一致性、渲染细节、取消恢复、通知、企业 API、运营面板

35 Provider 抽象
36 一致性
37 渲染实现细节
38 取消与恢复
39 通知系统
40 企业与 API
41 运营面板
附录：端到端时序图

目录（42–47）

Schema、质量门槛、自动剪辑、分镜、可解释性、爆款策略与自动修复

42 数据契约与 Schema
43 Quality Gates 实现
44 自动剪辑策略
45 分镜生成
46 可解释性
47 爆款 Playbooks
附录：自动修复策略库

目录（48–52）

Op 指令集、语义到时间线、工具链、A/B 实验、个性化与 Undo

48 Op Catalog
49 语义编辑 → 时间线
50 Toolchain
51 A/B 实验框架
52 个性化
附录：Undo 策略

开始阅读跳到最后回到顶部

11) Recipe 系统：把“100+ 生成器”工程化成可维护的工作流库

新增入口只新增 recipe 配置；核心引擎与执行管线保持稳定，可 A/B、可运营、可回放。

Recipe 的工程定义

输入 Schema：URL / script / slides / assets / language / platform
工作流 DAG：解析 → 结构化脚本 → 分镜 → 素材 → 配音 → 字幕 → 混音 → 渲染
默认参数：字幕样式、镜头节奏、BGM 音量、转场密度
质量门槛：字幕越界、黑屏、响度、时长偏差等硬指标

核心优势

入口多不等于代码乱：新增入口≈新增 recipe 配置
可 A/B：同输入套不同 recipe 比较留存/导出率/成本
可运营：爆款模板沉淀为 recipe，持续迭代默认参数

11.1 Recipe 配置示例

{
  "recipe_id": "r_url_to_shorts_v1",
  "name": "URL → 9:16 Shorts",
  "inputs": {
    "url": "string",
    "language": "zh-CN",
    "target_length_sec": 45,
    "tone": "energetic"
  },
  "defaults": {
    "aspect": "9:16",
    "fps": 30,
    "caption_style": "bold_pop",
    "cut_density_per_min": 22,
    "bgm_target_lufs": -18,
    "vo_target_lufs": -14
  },
  "dag": [
    {"id":"fetch", "type":"fetch_url"},
    {"id":"extract", "type":"extract_keypoints", "deps":["fetch"]},
    {"id":"script", "type":"write_script", "deps":["extract"]},
    {"id":"scenes", "type":"scene_plan", "deps":["script"]},
    {"id":"stock", "type":"stock_search", "deps":["scenes"]},
    {"id":"tts", "type":"tts_generate", "deps":["script"]},
    {"id":"caps", "type":"caption_generate_align", "deps":["tts"]},
    {"id":"mix", "type":"mix_audio", "deps":["tts"]},
    {"id":"preview", "type":"render_preview", "deps":["stock","caps","mix"]},
    {"id":"final", "type":"render_final", "deps":["preview"]}
  ],
  "quality_gates": [
    {"rule":"no_black_frames", "threshold": 0},
    {"rule":"caption_safe_area_violation", "threshold": 0},
    {"rule":"audio_clipping_ratio", "threshold": 0.001}
  ]
}

建议：Recipe 版本化（r_xxx_v1/v2），并提供“回放能力”（同输入 + 同版本可复现输出）用于调参与回归。

接口	用途	关键点
`POST /projects`	创建工程	返回 project_id + initial revision
`GET /projects/:id`	读取工程	支持按 scene/时间范围局部读取
`POST /projects/:id/patch`	提交 patch	携带 base_revision；返回 job_id
`POST /jobs/:id/cancel`	取消任务	取消传播到子 step；结算
`GET /jobs/:id`	查询任务状态	step 列表 + artifacts
`WS /projects/:id/stream`	实时更新	push revision、progress、preview url

模块	最小能力	第一版就要做的工程点
Project Service	工程文件 CRUD、revision、局部读取	稳定 ID、patch log、冲突检测
Planner Service	Chat → Patch（JSON）	schema 验证、repair、policy 注入
Locator Service	语义/时间/文本定位	索引结构、候选输出、置信度
Orchestrator	DAG、队列、重试、取消	幂等、优先级、分阶段扣费
Render Service	Preview/Final、Segment Cache	脏区间计算、拼接、缓存键
Asset Service	上传/检索/授权元数据	hash 去重、签名 URL、隔离
Billing/Credits	估算、预扣、结算、账本	usage_report、对账、申诉依据
Observability	日志/指标/追踪	质量门槛、告警、回归集

Worker	输入	输出	备注
stock_search	keywords, constraints	asset_ids ranked	必须 license_ok
tts_generate	text, voice_id	audio + timing	timing 帮字幕对齐
caption_align	timing, text	caption segments	safe area 规则
mix_audio	vo, bgm	mixed track	ducking + loudness
render_preview	project range	preview mp4	增量 segment cache
render_final	full project	final mp4	后台任务

规则	触发	动作	为什么
Remove Filler	停顿/赘词多	剪掉静默 > 300ms；重对齐字幕	节奏立刻提升
Hook Boost	前 2 秒密度低	前置亮点句；提高 cut density；关键词高亮	提升留存
Beat Cuts	BGM 鼓点明显	切镜对齐鼓点（容差 80ms）	更“爽”
Caption Pop	关键句出现	字幕放大 1.1x + 高亮色	信息更清晰
CTA Emphasis	结尾 CTA	加速节奏 + 强字幕 + 轻微抖动动效	提升转化

AI 导读

11) Recipe 系统：把“100+ 生成器”工程化成可维护的工作流库

Recipe 的工程定义

核心优势

11.1 Recipe 配置示例

12) 模型路由与降级：让系统在峰值、失败与成本压力下仍可交付

为什么必须做 Router

Router 的输入信号

12.1 降级阶梯（Fallback Ladder）

13) 协作与多人编辑：从一开始就按“可合并的工程文件”设计

13.1 最小协作能力（建议先做三件事）

13.2 Patch 合并策略（简单但好用）

14) 存储与缓存：决定“实时感”和单位成本的关键

14.1 三类存储（建议拆开）

14.2 缓存策略（最值钱）

14.3 Render Segment 键设计（示例）

15) 音频链路：旁白、BGM、ducking、响度标准化（决定“专业感”）

15.1 音频管线（典型）

15.2 质量门槛（建议硬性检查）

15.3 Ducking 伪代码（简化）

16) 字幕系统：生成、对齐、排版、安全区（短视频爆款必备）

16.1 字幕对齐三种路径

16.2 排版规则（建议固化）

16.3 Safe Area 规则示例（9:16）

17) API / BFF 设计：支持 WebSocket 进度回推与可恢复任务

17.1 最小接口集合

17.2 WebSocket 事件示例

18) 测试与评估：让“生成系统”可回归、可持续迭代

18.1 回归测试三件套

18.2 自动质量评估（可量化）

18.3 Timeline Diff 示例（概念）

19) 安全与合规：上传素材、版权与隔离（商业化绕不过）

19.1 最小安全清单

20) 基础设施与成本：把单位成本压到可持续（规模化必修课）

20.1 成本归因（必做）

20.2 立竿见影的降本策略

20.3 “先交付、后精炼”的产能模型

附录（续）：更完整的对象模型与事件溯源（Event Sourcing）

事件溯源建议结构

常见事件类型

21) LLM 规划器（Planner）：从自然语言到可执行 Patch 的“可控链路”

21.1 Planner 的输入

21.2 Planner 的输出

21.3 多阶段规划（更稳）

22) 定位系统（Locator）：把“那段/第二点/12 秒”映射到工程对象

22.1 三种定位信号（建议都实现）

时间信号

语义信号

文本信号

UI 选择信号（最强）

22.2 Locator 工具接口（示例）

23) 风格系统（Style System）：把“好看”变成模板、约束与可复用资产

23.1 Style Token（建议结构化）

23.2 Style Template 的复用

23.3 Style Profile 示例

24) Prompt / Tooling：把“提示词”产品化成可审计、可回放、可回归

24.1 Prompt 版本化（建议）

24.2 Prompt 回放（Replay）

24.3 Tool-first（强推荐）

25) 内容治理与策略：把风险前置到 Planning 与导出阶段

25.1 最有效的两个位置

25.2 最小策略对象（Policy）

25.3 Policy 示例（概念）

26) 现象级增长飞轮：工程系统如何反哺产品增长

26.1 飞轮 1：模板沉淀 → 更快成功率

26.2 飞轮 2：可回放 → 快速迭代质量

26.3 飞轮 3：成本运营 → 更强定价与 SLA

27) 全链路蓝图：把系统拆成可立即开工的模块清单

附录（再续）：失败模式与防护（Failure Modes）清单

常见失败模式

对应防护

28) 索引与检索：让“找素材/找句子/找片段”像数据库一样快

28.1 必备索引

28.2 更新时机

28.3 Transcript 索引结构示例

29) B-roll 选择引擎：比“生成镜头”更省钱、更稳的爆款路径

29.1 输入

29.2 排序打分（可落地）

29.3 选择策略：先稳后花

30) 节奏引擎（Pacing Engine）：把“好看”变成算法与约束