推荐语音输入法插件 whisper.el

manateelazycat · 2022 年12 月 22 日 01:54

Whisper的语音识别能力已经超越了大多数商业公司产品。

今天安装了一下，非常好用，说话就可以输入文字了。

默认 whisper-language 设置是 en, 所以你说中文，它会自动识别中文后翻译成英文。

把 whisper-language 设置成 zh 就可以正常识别中文了。

用法： whisper-run 开始记录，再执行一次 whisper-run 就识别并自动插入。

yaoni · 2022 年12 月 22 日 23:57

想问问懒猫有什么在电脑边的场景会需要用这个，感觉还是打字来的快。语音输入感觉中间会有很多停顿。

manateelazycat · 2022 年12 月 23 日 00:24

我就是想拥有一下哈，其实没啥用，哈哈哈哈哈。

估计irc聊天的时候，你说中文，它自己翻译成英文比较实用吧。

但是现在年纪大了，也不玩IRC了。

yaoni · 2022 年12 月 23 日 00:29

哈哈你这么一说，让我想起了我在客厅落灰的游戏机们

paradise · 2022 年12 月 23 日 02:52

用 ox-hugo 写博客的时候好用?

要是有一个方便的ChatGPT插件就好了.

stardiviner · 2022 年12 月 23 日 06:07

其实macOS用户直接用Diction语音输入也是非常方便的。

aqua0210 · 2023 年1 月 16 日 06:44

今天试了下用 whisper 转换一个 1小时的语音文件（西班牙语）为文本，并翻译为英文，用了大概 4个小时，因为用的是 medium。转换的质量还是很不错的，基本没什么错误。

whisper voice.m4a --model medium --language Spanish --task translate

不过这个 whiper.el 的 Emacs 插件不支持 Windows 系统。尝试做下了适配，但是都没成功。

下面这个命令在终端可以运行

ffmpeg -f dshow -i audio='麦克风阵列 (Realtek(R) Audio)' -t 300 -ar 16000 -y out.mp4

但在 whisper.el 中拼接出来的命令是：

"ffmpeg" "-f" "dshow" "-i" "audio='麦克风阵列 (Realtek(R) Audio)'" "-t" "300" "-ar" "16000" "-y" "out.mp4"

运行 M-x whisper-run 时提示：

error in process sentinel: FFmpeg command failed to record audio [2 times]

安装依赖：

ffmpeg 已经安装

whisper.cpp 也已经安装，并在 whisper.el 中适配了正确的路径

chinhant · 2023 年1 月 20 日 12:49

听写中文，准确度如何？可不可以添加个人词库，增加准确度？