推荐语音输入法插件 whisper.el

今天试了下用 whisper 转换一个 1小时的语音文件(西班牙语)为文本,并翻译为英文,用了大概 4个小时,因为用的是 medium。 转换的质量还是很不错的,基本没什么错误。

whisper voice.m4a --model medium --language Spanish --task translate

不过这个 whiper.el 的 Emacs 插件不支持 Windows 系统。尝试做下了适配,但是都没成功。

下面这个命令在终端可以运行

ffmpeg -f dshow -i audio='麦克风阵列 (Realtek(R) Audio)' -t 300 -ar 16000 -y out.mp4

但在 whisper.el 中拼接出来的命令是:

"ffmpeg" "-f" "dshow" "-i" "audio='麦克风阵列 (Realtek(R) Audio)'" "-t" "300" "-ar" "16000" "-y" "out.mp4"

运行 M-x whisper-run 时提示:

error in process sentinel: FFmpeg command failed to record audio [2 times]

安装依赖:

ffmpeg 已经安装

whisper.cpp 也已经安装,并在 whisper.el 中适配了正确的路径