‣
step1 软件自动生成SRT字幕
‣
- 软件会把视频里的audio自动上传到服务器处理
- 估计也是调用了whisper API
- 也自带翻译功能
- 也能导入现成的字幕;
‣
‣
- 如果是youtube,一般都有了自动生成的英语字幕;
‣
- 通用工具:音频转文字、转录+翻译,
- 基于OpenAI的Whisper API和ChatGPT API
- 原则:谁录制的视频,顺手生成一个srt字幕;
- 🚨 导出独立srt文件,不需要把字幕烧到视频中,校对完成后再烧到视频中;
‣
step2 SRT字幕校对(视频本身无需剪辑)
- 修改语音转文字过程中的错别字
- 删除无实质内容的口头禅
- 然后
- 这个
- 是吧
‣
step3 字幕翻译、生成双语字幕
‣
- GPT-4的API,秒出结果,质量很高;
- 已经封装为electron app,不需要命令行,直接下载翻译完成后的双语字幕
- 问题
- 断句有问题(字幕这种格式的固有问题,不是AI导致的问题),需要人工校对并手动调整一轮;搜索关键词:undefined。
方案3:舍弃双语字幕方案,只用中文字幕。VidCap
‣
step4 字幕封装
‣
- 修改后的SRT字幕,硬封装到视频中:FFMPEG
- 命令行操作,简单直接
- 缺点:没有字幕样式
‣
- 样式好;
- 缺点:视频体积大;
方案优劣对比
- 方案1 GPT字幕 + ffmpeg烧录:适用于双语字幕制作
- con
- 需要人工校准时间轴
- pro
- GPT-4,翻译质量更好。vidcap不确定用了什么模型(看起来字幕质量足够好)
- 方案2 Vid Cap:适用于中文视频配字幕
- con
- 无法双语字幕
- pro
- 字幕样式好看