今天试了下用 whisper 转换一个 1小时的语音文件(西班牙语)为文本,并翻译为英文,用了大概 4个小时,因为用的是 medium。 转换的质量还是很不错的,基本没什么错误。
whisper voice.m4a --model medium --language Spanish --task translate
不过这个 whiper.el 的 Emacs 插件不支持 Windows 系统。尝试做下了适配,但是都没成功。
下面这个命令在终端可以运行
ffmpeg -f dshow -i audio='麦克风阵列 (Realtek(R) Audio)' -t 300 -ar 16000 -y out.mp4
但在 whisper.el 中拼接出来的命令是:
"ffmpeg" "-f" "dshow" "-i" "audio='麦克风阵列 (Realtek(R) Audio)'" "-t" "300" "-ar" "16000" "-y" "out.mp4"
运行 M-x whisper-run 时提示:
error in process sentinel: FFmpeg command failed to record audio [2 times]
安装依赖:
ffmpeg 已经安装
whisper.cpp 也已经安装,并在 whisper.el 中适配了正确的路径