AI 字幕
生成精准字幕,支持逐词时间戳和 6 种专业预设样式。
AI 字幕生成器
字幕早已不是可有可无的选项——它是大多数人观看视频的方式。ChatCut 生成精准、风格化的字幕,具备逐词时间戳,并给你真正的外观控制权。
无需翻找菜单,打字说出你的需求。 告诉 AI”添加 Netflix 风格的字幕”,几秒内就会出现在你的时间线上,精准同步。
双引擎转录
ChatCut 运行两个转录引擎,让不同语言都能达到最佳效果:
- AssemblyAI – 针对英语和欧洲语言优化,在日常对话语音中准确率极高
- Huoshan – 专为中文(普通话、粤语)打造,正确处理声调语言和 CJK 字符分词
系统会根据你内容的语言自动选择合适的引擎。无需任何配置,即可获得精准的转录结果。
6 种专业预设
从一个好看的样式开始,再按需自定义:
- Netflix – 干净的白色文字,半透明背景,行业标准定位
- 极简 – 无背景,细微阴影,低调不抢眼
- Vox – 醒目的彩色逐词高亮(Vox Media 风格)
- 聚焦 – 高亮当前词,淡化周围文字
- TikTok – 大字号、居中、高对比度,专为竖屏视频设计
- YouTube – 任何尺寸都清晰可读,针对 16:9 内容优化
每个预设都是起点。所有视觉属性均可调整。
添加你的视频
导入素材或使用时间线上已有的内容
生成字幕
AI 转录并生成逐词时间戳和说话人识别
选择预设
从 6 种专业样式中选择:Netflix、极简、Vox、聚焦、TikTok 或 YouTube
自定义一切
调整 20+ 项属性:字体、大小、颜色、位置、动画、背景等
20+ 项可自定义属性
这正是 ChatCut 超越基础字幕工具的地方。你不会被限制在字体和颜色上。搭配 AI 配音旁白或文本编辑模式,打造完整的有声内容工作流。完整属性列表包括:
- 字体族、字重和字号
- 文字颜色、描边颜色、描边宽度
- 背景颜色和透明度
- 位置(x, y)和对齐方式
- 行高和字间距
- 逐词高亮颜色和动画
- 阴影属性
- 最大行数和每行字符数限制
- 动画样式(淡入、弹出、滑入)
每项属性都会在预览中实时更新。无需重新渲染、无需猜测。
生成逐词时间戳字幕,应用 Netflix 样式,字体增大,当前词以蓝色高亮,全部同步到时间线
逐词时间戳
ChatCut 不仅标注句子的时间戳——它标注每一个词。这使得以下功能成为可能:
- 逐词高亮 – 正在说的词会随语音亮起
- 精准裁剪 – 精确到词边界进行剪切
- 文本编辑模式 – 从文字稿中删除一个词,对应的视频也随之移除
- 精准同步 – 即使在快速语速下,字幕也不会漂移
说话人识别
多人对话内容自动处理。根据 Wistia 的研究,带字幕的视频能显著提升用户参与度。转录引擎会自动识别不同说话人并标注。这意味着:
- 采访字幕会显示谁在说话
- 多位主持人的播客节目能正确归属发言
- 圆桌讨论不会令人混淆
- 你可以为不同说话人设置不同颜色
CJK 语言支持
大多数字幕工具将中文、日文和韩文当作事后考虑。ChatCut 不同。Huoshan 引擎提供:
- 正确的字符分词(不会在词中间断开)
- 尊重语法的智能换行
- 正确的标点符号处理
- 适配竖排和横排文本的自然阅读流
如果你在制作中文内容或面向中文观众创作,这才是真正好用的字幕工具。
| Feature | ChatCut | Descript |
|---|---|---|
| 可自定义属性 | 20+ 项视觉属性 | 基础字体、颜色、位置 |
| 样式预设 | 6 种专业预设 | 预设选项有限 |
| CJK 语言支持 | 专用引擎,智能换行 | 基础支持,常有分词错误 |
| 逐词时间戳 | 支持,带逐词高亮 | 支持 |
| 说话人识别 | 自动识别,支持颜色区分 | 自动识别 |
用自然语言描述,ChatCut 帮你搞定
你无需手动放置文本框或调整时间。告诉 AI 你想要的样式,它就会配置好一切。想改变外观?再描述一下就行。
“把字幕调大一些,移到画面上方三分之一处,使用粗体字”——搞定。
“切换到 TikTok 风格,但保留我的自定义颜色”——搞定。
AI 理解上下文,并一次性将更改应用到所有字幕段落。
从文字稿和时间线中移除填充词('嗯'、'啊'、'那个'、'就是说'),应用聚焦预设和黄色逐词高亮
何时使用 AI 字幕
- 社交媒体 – 大多数社交媒体内容在静音状态下观看,字幕必不可少
- YouTube – 烧录字幕能提升观看时长和无障碍可及性
- 采访和播客 – 说话人识别让多人对话内容清晰明了
- 教育内容 – 逐词高亮有助于理解
- 国际内容 – 双引擎转录原生支持英语和中文