推荐语音输入法插件 whisper.el

Whisper的语音识别能力已经超越了大多数商业公司产品。

今天安装了一下, 非常好用, 说话就可以输入文字了。

默认 whisper-language 设置是 en, 所以你说中文, 它会自动识别中文后翻译成英文。

whisper-language 设置成 zh 就可以正常识别中文了。

用法: whisper-run 开始记录, 再执行一次 whisper-run 就识别并自动插入。

11 个赞

想问问懒猫有什么在电脑边的场景会需要用这个,感觉还是打字来的快。语音输入感觉中间会有很多停顿。

我就是想拥有一下哈,其实没啥用,哈哈哈哈哈。

估计irc聊天的时候,你说中文,它自己翻译成英文比较实用吧。

但是现在年纪大了,也不玩IRC了。

1 个赞

哈哈你这么一说,让我想起了我在客厅落灰的游戏机们 :rofl:

用 ox-hugo 写博客的时候好用?

要是有一个方便的ChatGPT插件就好了.

其实macOS用户直接用Diction语音输入也是非常方便的。

1 个赞

今天试了下用 whisper 转换一个 1小时的语音文件(西班牙语)为文本,并翻译为英文,用了大概 4个小时,因为用的是 medium。 转换的质量还是很不错的,基本没什么错误。

whisper voice.m4a --model medium --language Spanish --task translate

不过这个 whiper.el 的 Emacs 插件不支持 Windows 系统。尝试做下了适配,但是都没成功。

下面这个命令在终端可以运行

ffmpeg -f dshow -i audio='麦克风阵列 (Realtek(R) Audio)' -t 300 -ar 16000 -y out.mp4

但在 whisper.el 中拼接出来的命令是:

"ffmpeg" "-f" "dshow" "-i" "audio='麦克风阵列 (Realtek(R) Audio)'" "-t" "300" "-ar" "16000" "-y" "out.mp4"

运行 M-x whisper-run 时提示:

error in process sentinel: FFmpeg command failed to record audio [2 times]

安装依赖:

ffmpeg 已经安装

whisper.cpp 也已经安装,并在 whisper.el 中适配了正确的路径

听写中文,准确度如何?可不可以添加个人词库,增加准确度?