Google Flow UI/UX 深度研究报告
AI 导读
Google Flow UI/UX 深度研究报告 一、产品定位与生态系统 1.1 产品矩阵定位 Google Flow 是 Google Labs 旗下 labs.google/fx 创意工具套件的核心成员,与 ImageFX、MusicFX、Whisk 形成完整的 AI 创意生态: 工具 核心能力 底层模型 Flow AI 视频生成与叙事构建 Veo 2/3.1 + Imagen 4...
Google Flow UI/UX 深度研究报告
一、产品定位与生态系统
1.1 产品矩阵定位
Google Flow 是 Google Labs 旗下 labs.google/fx 创意工具套件的核心成员,与 ImageFX、MusicFX、Whisk 形成完整的 AI 创意生态:
| 工具 | 核心能力 | 底层模型 |
|---|---|---|
| Flow | AI 视频生成与叙事构建 | Veo 2/3.1 + Imagen 4 |
| ImageFX | 文本到图像生成 | Imagen 4 |
| Whisk | 图像混合与风格迁移 | Imagen 4 × Veo 2 |
| MusicFX | AI 音乐生成 | - |
设计巧思:Flow 被定位为"化身讲故事高手",强调的不只是单一视频生成,而是完整的叙事创作能力——这决定了其 UI 需要支持从单个片段到多场景叙事的完整工作流。
1.2 订阅分层体系与 UI 适配
Flow 的 UI 设计需要服务三个用户层级:
| 用户层级 | 月积分额度 | 功能范围 |
|---|---|---|
| 免费用户 | 100-180 积分 | 仅 Veo 3.1 |
| Google AI Pro | 1,000 积分 | 完整功能 |
| Google AI Ultra | 25,000 积分 | 优先访问实验功能 |
UI 体现:
- 顶部用户头像旁显示
ULTRA徽章,让高级用户有身份认同感 - 模型选择器中对不同层级用户显示不同的可用选项
- 积分即将耗尽时通过通知系统主动提醒
二、信息架构与导航系统
2.1 三层级 URL 结构
Flow 采用语义化 URL 设计,反映清晰的信息层级:
/fx/zh/tools/flow → 项目列表
/fx/zh/tools/flow/project/{project-id} → 项目详情(片段库)
/fx/zh/tools/flow/project/{id}/scenes/{id} → 场景构建器
设计考量:URL 结构直接映射到面包屑导航,用户可通过修改 URL 直接跳转,对高级用户友好。
2.2 面包屑导航的精妙设计
Flow > Jan 06 - 11:04 > Scenebuilder
[可编辑按钮] [状态指示]
交互细节:
- 项目名称可原地编辑:点击项目名旁的
edit图标可直接修改,无需进入设置页 - Scenebuilder 作为状态而非层级:点击可在片段库和场景构建器间切换,是一种视图模式而非导航深度
- chevron_right 分隔符:采用右箭头而非斜杠,暗示可点击导航
2.3 双抽屉导航架构
页面包含两个独立的抽屉式导航区域,通过 F8 键可切换焦点:
region "抽屉式通知导航栏(使用 F8 键可切换容器)"
无障碍设计亮点:
- 明确的 ARIA region 标签
- 键盘快捷键提示直接写入 region 名称
- 支持屏幕阅读器用户高效导航
三、核心交互模式深度解析
3.1 模式选择器(Combobox)的多维信息展示
底部输入区的模式选择器承载了大量信息:
[文生视频 ▼] [🔊 Veo 3.1 - Fast] [16:9] [⚙]
模式切换 模型+音频状态 宽高比 高级设置
设计巧思:
模型选择器复合显示
volume_up图标 + 模型名称组合,暗示该模型支持音频生成- 用户一眼就能识别 Veo 3 系列的音频能力
宽高比图标化
crop_16_9直接显示当前比例,无需文字说明- 点击可在 16:9(横向)和 9:16(纵向)间切换
设置按钮(tune 图标)的收敛设计
- 高级参数(如种子值、相机控制)收纳于此
- 保持主界面简洁,同时满足专业用户需求
3.2 五种视频生成模式的渐进式复杂度
Flow 提供五种生成模式,设计上遵循"简单到复杂"的渐进原则:
| 模式 | 输入要求 | 适用场景 | UI 复杂度 |
|---|---|---|---|
| Text to Video | 仅文本 | 快速原型 | ★☆☆☆☆ |
| Frames to Video (First) | 首帧图片 + 文本 | 角色延续 | ★★☆☆☆ |
| Frames to Video (First + Last) | 首尾帧 + 文本 | 过渡动画 | ★★★☆☆ |
| Ingredients to Video | 多素材图片 + 文本 | 复杂合成 | ★★★★☆ |
| Create Image | 文本(图片模式) | 素材准备 | ★★☆☆☆ |
交互设计要点:
- 选择高级模式时,输入区自动展开图片上传区域
- 支持拖拽图片到输入区
- 图片缩略图显示,支持预览和删除
3.3 提示词扩展器(Expander)的创意辅助系统
展开 按钮(pen_spark 图标)提供 AI 辅助提示词优化:
功能设计:
- 预设扩展器:由 Flow TV 团队提供的专业提示词模板
- 自定义扩展器:用户可创建、保存、管理个人模板
- 实时预览:扩展后的提示词可编辑、重新生成
UI 流程:
输入简单描述 → 点击"展开" → 选择扩展器 → 预览结果 → 确认或继续编辑
设计洞察:这解决了"提示词工程门槛高"的痛点,让新用户也能获得专业级输出。
四、视频卡片系统的微交互设计
4.1 卡片状态机
每张视频卡片可能处于多种状态:
生成中(显示百分比进度)
↓
生成成功(显示完整操作)
↓
生成失败(显示错误原因 + 重试选项)
状态展示细节:
- 进度百分比实时更新(如 "69%" → "78%" → "99%")
- 失败状态显示具体原因(如"此提示可能违反了我们关于生成知名人士相关内容的政策")
- 政策违规时提供直接的 FAQ 链接,而非笼统的错误提示
4.2 卡片翻转交互
flip_camera_android 图标触发卡片翻转动画:
正面:视频预览 + 播放控制 + 时长
背面:完整提示词 + 复制按钮 + 模型信息
设计意图:
- 默认只显示视觉内容,保持界面干净
- 提示词对于复用和学习很重要,但不需要常驻显示
- 翻转动画提供空间感和信息层级
4.3 多功能操作栏的信息密度
每张卡片悬浮时显示完整操作栏:
[添加到场景] [收藏] [编辑] [下载] [全屏] [更多选项]
↓
核心操作 辅助操作 溢出菜单
层级设计:
- 主要操作:添加到场景(工作流核心动作)
- 快速操作:收藏、下载(常用但非核心)
- 溢出菜单:删除、分享等低频操作
4.4 "重复使用提示"的巧妙复用模式
wrap_text 图标 + "重复使用提示"组合:
交互流程:
- 点击后提示词自动填入底部输入框
- 用户可微调后直接生成
- 支持跨项目复用(Flow TV 的 Reuse Prompt 功能)
设计价值:降低试错成本,鼓励迭代创作。
五、场景构建器(Scenebuilder)的专业编辑体验
5.1 时间轴控制的精细度
[播放/暂停] |====●=========| [全屏]
↑ ↑
起点把手 终点把手
时间显示: 0:00 / 0:08
交互细节:
- 起止把手:可拖动调整片段裁剪范围,tooltip 明确说明"拖动即可更改视频片段的开始/结束时间"
- 进度条指针:精确定位到任意帧,支持保存当前帧为素材
- 时间显示:当前位置 / 总时长,便于精确编辑
5.2 场景间添加逻辑
时间轴上的 add 按钮提供两种添加位置:
[+] 片段内添加(在当前片段后插入)
[+ 在最后一个片段之后添加片段]
触发操作类型:
- Jump to...:生成与前片段无缝衔接的新场景
- Extend...:延长当前片段的动作
5.3 移动端适配提示
"Scene Builder 尚不支持移动设备"
[前往"片段"]
设计考量:
- 场景构建需要精细拖拽操作,移动端体验受限
- 提供明确的替代方案("前往片段")而非简单报错
- 体现了"优雅降级"的设计原则
六、素材管理的信息组织
6.1 双维度筛选系统
内容类型切换(互斥单选):
[🎬 Videos] [🖼 Images]
视图模式切换(互斥单选):
[舒适视图] [网格视图] [收藏视图]
view_cozy grid_on favorite
设计分析:
- 两组筛选器独立运作,可自由组合
- 收藏视图作为"智能过滤器"而非视图模式,但 UI 上与视图切换并列,可能造成概念混淆
6.2 日期分组与空状态处理
素材按日期自动分组:
"2026年1月6日"
空状态提示:
"在提示框中输入内容即可开始"
设计要点:
- 日期分组帮助用户回溯创作历史
- 空状态引导用户进行下一步操作,而非仅展示空白
七、高级编辑功能的交互设计
7.1 物体插入/移除的区域绘制
用户可通过在画面上绘制矩形框来指定编辑区域:
To select where the object should appear or be removed from, draw a box on the image.
交互流程:
- 选择 Insert 或 Remove 模式
- 在预览帧上拖拽绘制矩形区域
- 输入描述(要添加/删除的物体)
- 生成编辑后的视频
7.2 相机控制的预设选项
Camera Position 和 Camera Motion 提供预设选项,无需用户描述复杂的镜头语言:
- 相机位置:鸟瞰、正面、侧面等
- 相机运动:推进、拉远、平移、跟拍等
设计价值:降低影视专业术语门槛,让非专业用户也能使用电影级镜头。
7.3 帧保存与素材复用循环
场景构建器暂停 → 保存当前帧 → 帧进入图片库 → 作为素材重复使用
设计精妙之处:
- 形成闭环的素材生态
- 解决 AI 视频"角色一致性"难题
- 从输出中提取输入,迭代改进
八、Flow TV 的展示与灵感系统
8.1 频道化的内容组织
Flow TV 将示例作品组织为主题频道:
Doughmotion | Inaction Figures | Day Chasers | ...
Veo 3 (With Audio) 标签表示使用的模型和功能
频道命名风格:
- 使用双关语和创意命名(如"In-faux-mercial" = Infomercial 的戏仿)
- 每个频道聚焦特定创作风格或主题
8.2 电视遥控器隐喻
Flow TV 采用电视遥控器的交互隐喻:
[All Channels] [Previous Clip] [Pause] [Next Clip] [Loop Channel] [Unmute] [Full Screen] [Share]
状态反馈设计:
Playing/Paused状态文字提示Muted/Unmuted明确音频状态Mixing表示频道随机播放模式
8.3 提示词透明度与复用
每个视频都可查看完整提示词:
checkbox "Show additional data" → 展开详细信息
link "Reuse Prompt" → 一键复制到 Flow 工作区
设计理念:教学与创作工具合一,用户可从优秀作品中学习提示词技巧。
九、图片生成模式的独立体验
9.1 Nano Banana Pro 模型的品牌化
图片生成使用 🍌 Nano Banana Pro 模型:
button "🍌 Nano Banana Pro"
品牌设计分析:
- 使用 emoji + 品牌名称,增加记忆点
- "Nano Banana" 命名轻松有趣,降低技术门槛感
- "Pro" 后缀暗示专业能力
9.2 迭代编辑工作流
生成图片 → 悬浮点击 Edit → 输入修改描述 → 生成变体
支持的编辑类型:
- 风格调整
- 元素添加/删除
- 细节修改
十、ImageFX 的交互对比分析
10.1 输入区的差异化设计
ImageFX 独特元素:
- 内联样式芯片:
35mm film|minimal|sketchy等可点击标签 - 种子值锁定:
lock_open_right图标控制随机性 - "手气不错"按钮:
casino图标,随机生成灵感
10.2 设计语言的一致性
Flow 与 ImageFX 共享的设计元素:
- 相同的 combobox 下拉样式
- 一致的帮助按钮位置(
help_outlined) - 统一的底部免责声明格式
十一、无障碍与国际化设计
11.1 ARIA 标签的完整实现
region "Notifications alt+T"
button "调整音量"
generic "拖动即可更改视频片段的开始时间"
无障碍设计要点:
- 所有交互元素都有描述性标签
- 复杂操作提供额外说明
- 键盘快捷键在标签中明确标注
11.2 本地化的深度适配
- 界面完全支持中文
- 动态占位符本地化("使用文本生成视频…")
- 错误信息本地化("此提示可能违反了我们关于生成知名人士相关内容的政策")
11.3 RTL(右到左)语言支持
语言选择器包含希伯来语、乌尔都语等 RTL 语言,表明界面支持双向文本布局。
十二、积分系统的透明化设计
12.1 积分成本可视化
模型选择器旁可查看每次生成的积分消耗:
| 模型 | 积分/次 |
|---|---|
| Veo 2 - Fast | 50 |
| Veo 2 - Quality | 100 |
| Veo 3.1 - Fast | 25-50 |
| Veo 3.1 - Quality | 100 |
12.2 积分状态的多触点提示
- 账户菜单:显示剩余积分
- 生成前:预估消耗
- 积分不足时:阻断提示 + 充值引导
- 月度刷新:通知系统提醒
十三、错误处理与引导设计
13.1 策略违规的温和处理
"此提示可能违反了我们关于生成知名人士相关内容的政策。请尝试使用其他提示或发送反馈。"
[政策] → 链接到 FAQ
设计特点:
- 使用"可能"而非绝对否定
- 提供具体的政策类型说明
- 给出替代方案(修改提示)
- 提供反馈入口(可能是误判)
13.2 生成失败的复用引导
失败的生成仍显示"重复使用提示"按钮,鼓励用户调整后重试。
十四、产品更新通知系统
14.1 新功能公告条
项目列表顶部的公告卡片:
heading "Nano Banana Pro Has Arrived!"
button "See it in action."
button [close]
设计细节:
- 可关闭的横幅设计
- 直接链接到功能演示
- 不阻断主流程
14.2 ImageFX 的弹出公告
button "打开更新日志"
heading "Whisk 重磅登场:精确模式 + Veo 3 珠联璧合!"
跨产品推广设计:在 ImageFX 中推广 Whisk 新功能,促进产品矩阵的相互引流。
十五、设计系统总结
15.1 图标语言系统
Flow 使用 Google Material Icons 的一致图标集:
| 图标 | 语义 | 使用场景 |
|---|---|---|
videocam |
视频内容 | 类型切换 |
image |
图片内容 | 类型切换 |
favorite |
收藏 | 卡片操作 |
edit |
编辑 | 项目/卡片 |
delete |
删除 | 项目管理 |
download |
下载 | 导出 |
fullscreen |
全屏 | 预览 |
volume_up |
音量/音频 | 模型状态 |
tune |
设置 | 高级选项 |
arrow_forward |
提交/前进 | 生成按钮 |
15.2 颜色与视觉层级
基于深色背景的设计:
- 主操作使用高对比度色彩
- 状态指示器(如进度百分比)使用品牌色
- 错误状态使用红色系
15.3 动效原则
- 卡片翻转动画提供空间感
- 进度百分比平滑过渡
- 模式切换使用渐变而非跳变
十六、设计优化建议
16.1 可发现性提升
- 功能引导层:首次使用时增加交互式教程
- 快捷键速查表:在帮助中心提供完整的键盘快捷键列表
- 工具提示增强:悬浮按钮时显示操作说明
16.2 效率优化
- 批量操作:支持多选卡片进行批量删除/收藏
- 拖拽排序:在项目列表支持拖拽调整顺序
- 历史版本:保存提示词修改历史,支持版本回退
16.3 专业功能扩展
- 关键帧编辑:更精细的时间轴控制
- 转场效果:场景间添加过渡效果
- 多轨时间轴:支持音频轨道独立编辑
16.4 协作功能
- 项目分享:生成可分享的预览链接
- 团队工作区:支持多人协作创作
- 评论系统:在时间轴特定位置添加批注
十七、结论
Google Flow 展现了 Google 在 AI 创意工具领域的深厚设计功底。从信息架构到微交互,从无障碍设计到国际化适配,Flow 在专业创作能力与易用性之间取得了精妙平衡。
核心设计哲学:
- 渐进式复杂度:从简单文本生成到复杂场景构建,用户可按需深入
- 迭代式创作:鼓励从输出中提取素材,形成创作闭环
- 透明化 AI:明确的积分成本、模型能力、政策边界
- 生态协同:与 ImageFX、Whisk 无缝衔接,构建完整创意流水线
Flow 的 UI/UX 设计值得同类产品学习借鉴,尤其是其在复杂功能与简洁界面间的平衡艺术。
报告生成时间:2026年1月6日 研究对象:Google Flow (labs.google/fx/tools/flow)