Whisper的语音识别能力已经超越了大多数商业公司产品。
今天安装了一下, 非常好用, 说话就可以输入文字了。
默认 whisper-language
设置是 en
, 所以你说中文, 它会自动识别中文后翻译成英文。
把 whisper-language
设置成 zh
就可以正常识别中文了。
用法: whisper-run 开始记录, 再执行一次 whisper-run 就识别并自动插入。
Whisper的语音识别能力已经超越了大多数商业公司产品。
今天安装了一下, 非常好用, 说话就可以输入文字了。
默认 whisper-language
设置是 en
, 所以你说中文, 它会自动识别中文后翻译成英文。
把 whisper-language
设置成 zh
就可以正常识别中文了。
用法: whisper-run 开始记录, 再执行一次 whisper-run 就识别并自动插入。
想问问懒猫有什么在电脑边的场景会需要用这个,感觉还是打字来的快。语音输入感觉中间会有很多停顿。
我就是想拥有一下哈,其实没啥用,哈哈哈哈哈。
估计irc聊天的时候,你说中文,它自己翻译成英文比较实用吧。
但是现在年纪大了,也不玩IRC了。
哈哈你这么一说,让我想起了我在客厅落灰的游戏机们
用 ox-hugo 写博客的时候好用?
要是有一个方便的ChatGPT插件就好了.
其实macOS用户直接用Diction语音输入也是非常方便的。
今天试了下用 whisper 转换一个 1小时的语音文件(西班牙语)为文本,并翻译为英文,用了大概 4个小时,因为用的是 medium。 转换的质量还是很不错的,基本没什么错误。
whisper voice.m4a --model medium --language Spanish --task translate
不过这个 whiper.el 的 Emacs 插件不支持 Windows 系统。尝试做下了适配,但是都没成功。
下面这个命令在终端可以运行
ffmpeg -f dshow -i audio='麦克风阵列 (Realtek(R) Audio)' -t 300 -ar 16000 -y out.mp4
但在 whisper.el 中拼接出来的命令是:
"ffmpeg" "-f" "dshow" "-i" "audio='麦克风阵列 (Realtek(R) Audio)'" "-t" "300" "-ar" "16000" "-y" "out.mp4"
运行 M-x whisper-run 时提示:
error in process sentinel: FFmpeg command failed to record audio [2 times]
安装依赖:
ffmpeg 已经安装
whisper.cpp 也已经安装,并在 whisper.el 中适配了正确的路径
听写中文,准确度如何?可不可以添加个人词库,增加准确度?