[WIP] OCR with Emacs and Org-mode

jimx · 2018 年12 月 9 日 12:32

之前正好玩过一会这个chineseocr，试着实现了一下接口，每次调用的时候把光标处的前一张图片发到服务端做识别然后把结果插入到图片后面的quote block中，效果如下：

在cpu上做OCR确实很慢，一次要十多秒，换成用cuda之后基本上可以瞬间出结果，唯一的问题就是配置服务端太麻烦了。代码放在了https://gist.github.com/Jimx-/4702dce72586f4e56177b20e7768f649