目前市面上最易用、用户量最大的视频编辑软件是剪影;但剪影的字幕识别功能要收费!
目前市面上免费好用的字幕识别工具有很多,这里推荐使用buzz。
1. 下载安装buzz:https://github.com/chidiwilliams/buzz/releases
2. 直接将音频或视频拖到buzz中,会弹出如下配置
注:首次使用时会自动下载语音识别模型,可能耗时较久;
配置介绍:
Whisper:表示使用OpenAI开源的Whisper模型;
Medium:表示使用中等大小的模型,更大的模型会识别出更准确的结果,但也会更耗性能;实测Medium已经够用,使用Medium识别2分钟的视频需要耗时1分钟,如果选择更大的模型耗时将更久。
Transcribe:表示从录制的视频或音频中识别字幕,buzz还支持从麦克风的输入音频中实时识别字幕;
Chinese:表示将字幕识别为中文;
SRT:表示将音频或视频中的声音识别为字幕,buzz还支持识别为文本或其它格式。
注:buzz使用CPU运行语音模型,因此识别过程中会跑满CPU;也有些软件使用GPU运行模型,但那些都没有buzz好用。
1.0> 将视频拖到剪影中;选中视频,音频音量往大调20dB,即调到最大(本人录制的声音比较小);
注:调整完音量后,先剪辑视频,视频剪辑完成后再生成和添加字幕
2.0> 导入字幕;
注:将字幕添加到轨道上时,先调整字幕的起始时间,确保字幕的开始时间与音频对上;
注:再全选字幕后,设置字幕样式,推荐选择第1个样式;
3.0> 全选字幕,检查、修改字幕中的错别字
4.0> 导出时选择4K分辨率
注:剪影在导出时使用CPU处理视频,因此导出过程会跑满CPU。