寻找语音识别的工具

时隔将近一年,终于有了一款开源、离线的多语种语音识别/翻译工具。

我用两小时的英文播客测试了(macOS 13.0.1 M1+8GB RAM),选择 medium 模型的话要用两个半小时转录成文字(字幕),small 模型应该会快一些。如果不是 macOS 并且有显卡的话速度快很多。

GitHub

中文介绍

One More Thing

生成的字幕可以通过 subed 编辑,或使用 translate-mode 翻译。

4 个赞