文本驱动剪辑
像编辑文档一样编辑视频。删除文字、重排段落,时间线自动跟随。
文本驱动视频剪辑
如果剪辑视频像编辑文档一样简单呢?在 ChatCut 中,就是这样。你的视频会被转录为文本,你对文本所做的每一次编辑(删除一个词、移除一段话、重新排列段落)都会即时同步到视频时间线。
别翻菜单了,直接告诉 ChatCut 你要什么。 说一句 “去除所有口头禅”,AI 同时编辑转录文本和时间线,一步到位。

工作原理
ChatCut 以逐词时间戳转录你的视频,然后将转录文本呈现为可编辑文档。编辑文本,对应的视频片段会自动裁剪、移动或删除。通过 Zero 实时引擎,修改在毫秒内同步到时间线。
无需反复拖动进度条,不用标记入点和出点。阅读转录文本,做出编辑,完成。
导入视频
将素材添加到项目中:采访、vlog、播客、讲座,任何包含语音的内容
生成转录
双引擎转录,创建逐词时间戳并自动识别说话人
编辑文本
删除文字、移除段落、重排章节、消除间隙——就像编辑文档一样
时间线即时同步
每次文本编辑都通过 Zero 引擎实时更新视频时间线
7 种编辑操作
文本编辑器支持视频剪辑中最重要的操作:
删除文字
在转录文本中选择一个词或短语并删除。对应的音视频会从时间线中移除。适合清理口误、重复词或不需要的表达。
删除段落
一次性移除整个段落。选中一段内容,它就会从转录文本和时间线中同时消失。快速裁剪不需要的片段。
分割
在任意词语边界处分割转录文本(和时间线)。适合将长镜头分割成多个片段以便重新排列。
重新排序
拖动转录段落来重新排列内容,视频自动跟随。通过移动段落来调整内容顺序,而不是在时间线上挪动片段。
消除间隙
删除内容后,时间线上可能留有空白。消除间隙会移除空白区域,将后续内容向前拉。
更改说话人
当自动识别需要修正时,重新分配说话人标签。确保多人对话内容的说话人归属正确。
编辑文本
修改转录文本本身而不改变视频。适合在生成字幕之前纠正转录错误。
AI 助手在转录文本中识别并移除了 47 个口头禅。时间线已更新:移除了 23 秒的无效音频,间隙自动消除。
双引擎转录
与 ChatCut 的字幕系统一样,文本驱动剪辑使用两个转录引擎:
- AssemblyAI — 针对英语和欧洲语言优化
- Huoshan — 专为中文打造,支持智能分词
逐词时间戳确保每次编辑都精确到帧。删除一个词,只有该词的音频被移除,而不是周围的句子。
通过 Zero 引擎实时同步
这是让文本驱动剪辑感觉即时响应的技术基础。ChatCut 使用 Zero(由 Rocicorp 开发)进行实时数据同步。当你从转录文本中删除一个词时:
- 写入转录文本的更新
- Zero 传播变更
- 时间线反映编辑结果
这一切在毫秒内完成。你不需要等待重新渲染或重新同步。时间线更新的速度与你编辑文本的速度一样快。正如 Wistia 的研究所示,更紧凑的剪辑带来更高的观看留存率,因此速度至关重要。
AI 助手集成
文本驱动剪辑与 AI 助手结合后更加强大。无需手动选择和删除内容,直接描述你想要的效果。你还可以将此功能与 AI 字幕 搭配使用,打造完整的字幕工作流:
- “去除所有口头禅” — AI 助手识别并删除所有嗯、啊、然后、就是、其实、对吧等口头禅
- “把讨论定价的那段剪掉” — AI 助手找到相关段落并移除
- “把结论部分移到案例分析前面” — AI 助手重新排列转录段落
- “删除所有超过 2 秒的停顿” — AI 助手收紧全篇节奏
AI 助手以编程方式执行文本编辑操作,批量处理手动操作需要几分钟才能完成的工作。
口头禅已移除(31 处),长停顿已裁剪(12 个间隙已消除),结尾总结已移至开场白之后。总时长从 8:42 缩短至 6:15。
| Feature | ChatCut | Descript |
|---|---|---|
| AI 助手自动化 | 自然语言指令执行批量编辑 | 手动编辑转录文本 |
| 口头禅移除 | AI 助手一条指令移除所有口头禅 | 手动或半自动 |
| 中文支持 | 专用引擎,智能分词 | 基础 CJK 支持 |
| 实时同步 | 通过 Zero 引擎毫秒级同步 | 处理后才同步 |
| 批量操作 | 描述编辑需求,AI 在整篇转录中执行 | 逐段手动编辑 |
| Feature | ChatCut | CapCut |
|---|---|---|
| 文本驱动剪辑 | 完整的转录编辑器,支持 7 种操作 | 仅自动字幕,无转录编辑 |
| 逐词删除 | 删除任意词语,视频即时更新 | 不支持 |
| 文本重排 | 拖动段落即可重排视频 | 不支持 |
| AI 助手 | 自然语言批量编辑指令 | 无 AI 助手编辑 |
| 说话人识别 | 自动识别并支持手动修正 | 功能有限 |
你描述编辑需求,ChatCut 来执行
文本驱动剪辑与 AI 助手控制的结合,创造了一种与传统视频剪辑截然不同的工作流程。你不是在操控时间线,而是描述最终视频应该是什么样子,系统帮你实现。
“只保留嘉宾谈论机器学习的部分,删除其他所有内容,然后消除所有间隙。”
这是一个复杂的编辑。在传统编辑器中,需要花 15 分钟反复拖动进度条、标记、剪切、波纹删除。在 ChatCut 中,一句话搞定。
已定位 12:34 到 15:08 的离题段落。已从转录文本和时间线中移除。间隙已消除。时长缩短 2:34。