智能字幕生成

字幕生成器

使用AI说话人识别、Filler清理和隐私保护生成专业字幕。可视化时间轴编辑,导出SRT/VTT。

每月30分钟免费
无需注册
无水印
24小时自动删除

方案亮点

专为字幕与内容团队打造的 AI 工作流

三栏编辑器集成音频波形、逐字稿、字幕时间轴,快速校对并导出多个格式。

1

说话人真实姓名映射

自动捕捉“大家好,我是…”等自我介绍,一键替换 Speaker 1/2/3。

2

中英双语 Filler 清理

支持 35+ 口头禅,字幕更专业,后期剪辑更省时。

3

Off-Record 隐私保护

敏感内容随时标记,导出时自动排除,适合采访与法务场景。

💡已被 3,500+ 记者、播客团队与字幕工作室采用。
免费预览

拖拽或选择文件,即刻生成字幕。

支持 MP4、MOV、MKV、WebM、MP3、WAV、M4A、AAC、FLAC 等常见格式。

访客可生成 5 分钟预览,满意后随时注册解锁完整字幕与导出。

高精度模式

登录后可启用高精度模式(Pro 方案)。

说话人分离

登录后可启用说话人分离(Basic 及以上)。

加密存储行动项 AI

查看字幕示例

一次生成,包含所有交付物

满足媒体、教育、法律等场景的字幕制作需求。

精准字幕段落

按说话人自动分段,支持段落合并与批量调整。

波形编辑工作台

拖拽波形即可微调毫秒级时间轴,对齐画面毫不费力。

AI 提效工具

一键清理口头禅、智能推荐真实姓名、自动标注事实核查重点。

多格式导出

支持 SRT、VTT、TXT、Markdown,满足所有平台上传需求。

AI 摘要

  • · 2 分钟产品演示,主持人与工程师讲解 Harku 如何自动匹配真实姓名并保持时间轴对齐。
  • · 重点展示:上传 → 波形校对 → 一键导出 SRT/VTT 的完整流程。

编辑器里展示的操作

  • · 说话人建议把 “Speaker 1” 换成 “Maya(主持人)”。
  • · Filler 清理去掉 “嗯/然后/you know” 等口头禅,时间戳保持不变。
  • · Off-Record 开关隐藏内部定价备注,导出文件自动排除。

最终交付

  • · 带时间戳与说话人标签的字幕段落。
  • · 对齐波形的逐字稿,可继续微调。
  • · SRT、VTT、TXT、Markdown、JSON 多格式即时下载。

智能字幕生成

自动字幕生成器

The Subtitle Generator lets teams upload, edit, and export subtitles without juggling multiple tools.

极速生成
上传MP4/MP3,30秒内生成字幕
🌍多语言支持
50+语言,自动识别或手动选择
🆓免费开始
每天30分钟免费额度,无需注册
🔒隐私优先
24小时自动删除,数据安全

竞品没有的独家功能

专为专业用户设计的智能功能

AI speaker detection, filler cleanup, and off-record controls are built directly into the Subtitle Generator workflow.

🎙️

AI说话人识别

自动从自我介绍中提取真实姓名

  • "Hi, I'm John Smith" → 自动建议 "John Smith"
  • "大家好,我是张伟" → 自动建议 "张伟"
  • 支持中英文姓名识别
  • 一键应用建议的名字

与其他只提供通用的'Speaker 1/2/3'标签的工具不同,我们的AI会自动识别并建议自我介绍中的真实姓名,节省大量手动重命名时间。

🧹

Filler Word 清理(中英文)

一键清除35+个口头禅,让字幕更专业

  • 英文17个:um, uh, like, you know...
  • 中文18个:嗯, 啊, 这个, 那个...
  • 清理前:嗯...这个...我觉得...那个...很好
  • 清理后:我觉得很好

大多数竞品如Descript仅支持英文口头禅清理。我们是唯一同时提供中英文双语口头禅清理的解决方案。

🔒

Off-Record 隐私保护

标记敏感内容,导出时自动过滤

  • 点击段落 → 标记为不可发布
  • 导出时自动排除敏感内容
  • 适合调查性新闻、法律采访
  • 保护源隐私和敏感信息

这是独家功能,任何其他字幕工具都没有。非常适合记者、律师和处理敏感信息的专业人士。

常见问题

如何从 MP4 生成 SRT?

上传 MP4 文件,点击“上传生成字幕”,等待 30 秒即可自动完成。点击“导出”选择 SRT,立刻下载 UTF-8 编码的字幕文件。

SRT 和 VTT 有什么区别?

SRT 是最通用的字幕格式,兼容几乎所有视频平台;VTT 支持更多样式与定位,适合网页播放。Harku 可同时导出两种格式,选择适合自己的即可。

字幕不同步怎么办?

在编辑器中使用“整体时间偏移”工具,输入毫秒偏移(+500ms 表示延后,-500ms 表示提前)。也可在波形上直接拖拽某一段落,精准调轴。

免费额度是多少?

无需注册即可每月免费生成 30 分钟字幕,包含所有功能与导出格式。需要更长时长可随时升级套餐。

支持哪些语言?

支持 50+ 语言,包括中英双语。系统可自动识别。

导出的字幕如何使用?

下载 SRT 或 VTT 文件后,可以直接上传至 YouTube、Bilibili、Vimeo 等平台,或导入 Premiere、Final Cut 等剪辑软件。需要烧录字幕时,可在剪辑软件中开启“烧录字幕”功能。

AI 说话人识别如何工作?

系统会捕捉“大家好,我是张伟”此类自我介绍,并自动建议真实姓名,省去手动修改 Speaker 1/2/3 的步骤。

什么是 Filler 清理?

Filler 指口头禅,如“嗯”、“啊”、“这个”或“um”、“like”。一键清理可以让字幕更专业,也方便后续剪辑。

Off-Record 有什么作用?

可标记采访或会议中的敏感内容,导出时自动排除,确保隐私安全。

生成速度快吗?

10 分钟的音频通常 30-60 秒即可完成。实际时间取决于文件长度和服务器负载,界面会实时展示进度。

支持多大文件?

单个文件最大 500MB。免费用户单次 30 分钟,付费用户可达 4 小时。

准备创建专业字幕?

立即免费试用,无需注册,无水印。