方案亮点
专为字幕与内容团队打造的 AI 工作流
三栏编辑器集成音频波形、逐字稿、字幕时间轴,快速校对并导出多个格式。
说话人真实姓名映射
自动捕捉“大家好,我是…”等自我介绍,一键替换 Speaker 1/2/3。
中英双语 Filler 清理
支持 35+ 口头禅,字幕更专业,后期剪辑更省时。
Off-Record 隐私保护
敏感内容随时标记,导出时自动排除,适合采访与法务场景。
拖拽或选择文件,即刻生成字幕。
支持 MP4、MOV、MKV、WebM、MP3、WAV、M4A、AAC、FLAC 等常见格式。
访客可生成 5 分钟预览,满意后随时注册解锁完整字幕与导出。
高精度模式
登录后可启用高精度模式(Pro 方案)。
说话人分离
登录后可启用说话人分离(Basic 及以上)。
查看字幕示例
一次生成,包含所有交付物
满足媒体、教育、法律等场景的字幕制作需求。
精准字幕段落
按说话人自动分段,支持段落合并与批量调整。
波形编辑工作台
拖拽波形即可微调毫秒级时间轴,对齐画面毫不费力。
AI 提效工具
一键清理口头禅、智能推荐真实姓名、自动标注事实核查重点。
多格式导出
支持 SRT、VTT、TXT、Markdown,满足所有平台上传需求。
AI 摘要
- · 2 分钟产品演示,主持人与工程师讲解 Harku 如何自动匹配真实姓名并保持时间轴对齐。
- · 重点展示:上传 → 波形校对 → 一键导出 SRT/VTT 的完整流程。
编辑器里展示的操作
- · 说话人建议把 “Speaker 1” 换成 “Maya(主持人)”。
- · Filler 清理去掉 “嗯/然后/you know” 等口头禅,时间戳保持不变。
- · Off-Record 开关隐藏内部定价备注,导出文件自动排除。
最终交付
- · 带时间戳与说话人标签的字幕段落。
- · 对齐波形的逐字稿,可继续微调。
- · SRT、VTT、TXT、Markdown、JSON 多格式即时下载。
智能字幕生成
自动字幕生成器
The Subtitle Generator lets teams upload, edit, and export subtitles without juggling multiple tools.
- ⚡极速生成
- 上传MP4/MP3,30秒内生成字幕
- 🌍多语言支持
- 50+语言,自动识别或手动选择
- 🆓免费开始
- 每天30分钟免费额度,无需注册
- 🔒隐私优先
- 24小时自动删除,数据安全
竞品没有的独家功能
专为专业用户设计的智能功能
AI speaker detection, filler cleanup, and off-record controls are built directly into the Subtitle Generator workflow.
AI说话人识别
自动从自我介绍中提取真实姓名
- "Hi, I'm John Smith" → 自动建议 "John Smith"
- "大家好,我是张伟" → 自动建议 "张伟"
- 支持中英文姓名识别
- 一键应用建议的名字
与其他只提供通用的'Speaker 1/2/3'标签的工具不同,我们的AI会自动识别并建议自我介绍中的真实姓名,节省大量手动重命名时间。
Filler Word 清理(中英文)
一键清除35+个口头禅,让字幕更专业
- 英文17个:um, uh, like, you know...
- 中文18个:嗯, 啊, 这个, 那个...
- 清理前:嗯...这个...我觉得...那个...很好
- 清理后:我觉得很好
大多数竞品如Descript仅支持英文口头禅清理。我们是唯一同时提供中英文双语口头禅清理的解决方案。
Off-Record 隐私保护
标记敏感内容,导出时自动过滤
- 点击段落 → 标记为不可发布
- 导出时自动排除敏感内容
- 适合调查性新闻、法律采访
- 保护源隐私和敏感信息
这是独家功能,任何其他字幕工具都没有。非常适合记者、律师和处理敏感信息的专业人士。
常见问题
如何从 MP4 生成 SRT?+
上传 MP4 文件,点击“上传生成字幕”,等待 30 秒即可自动完成。点击“导出”选择 SRT,立刻下载 UTF-8 编码的字幕文件。
SRT 和 VTT 有什么区别?+
SRT 是最通用的字幕格式,兼容几乎所有视频平台;VTT 支持更多样式与定位,适合网页播放。Harku 可同时导出两种格式,选择适合自己的即可。
字幕不同步怎么办?+
在编辑器中使用“整体时间偏移”工具,输入毫秒偏移(+500ms 表示延后,-500ms 表示提前)。也可在波形上直接拖拽某一段落,精准调轴。
免费额度是多少?+
无需注册即可每月免费生成 30 分钟字幕,包含所有功能与导出格式。需要更长时长可随时升级套餐。
支持哪些语言?+
支持 50+ 语言,包括中英双语。系统可自动识别。
导出的字幕如何使用?+
下载 SRT 或 VTT 文件后,可以直接上传至 YouTube、Bilibili、Vimeo 等平台,或导入 Premiere、Final Cut 等剪辑软件。需要烧录字幕时,可在剪辑软件中开启“烧录字幕”功能。
AI 说话人识别如何工作?+
系统会捕捉“大家好,我是张伟”此类自我介绍,并自动建议真实姓名,省去手动修改 Speaker 1/2/3 的步骤。
什么是 Filler 清理?+
Filler 指口头禅,如“嗯”、“啊”、“这个”或“um”、“like”。一键清理可以让字幕更专业,也方便后续剪辑。
Off-Record 有什么作用?+
可标记采访或会议中的敏感内容,导出时自动排除,确保隐私安全。
生成速度快吗?+
10 分钟的音频通常 30-60 秒即可完成。实际时间取决于文件长度和服务器负载,界面会实时展示进度。
支持多大文件?+
单个文件最大 500MB。免费用户单次 30 分钟,付费用户可达 4 小时。