想问下各位是怎么用 emacs 阅读标注 pdf 的

今天刚开始研究 pdf,好多事情没搞明白。环境是 linux + Doom emacs。

先是装了 pdf-tools,如果想对 pdf 进行标注的话,只能用鼠标选择文字吗?因为我在 pdf 中按了 v 的话,说是进入了 visual mode,但仍然无法用键盘选择文字。

然后又看到了 org-noter 和 org-pdftools,似乎都是由论坛里的大神 fuxialexander 写的,先在这里膜拜一下。想问的是,pdftools 貌似是将 org-noter 整合进去了,但又没有整合完毕的样子,我应该用哪个呢?

其实更期待各位发一下自己用 emcas 阅读 pdf 的完整工作流,比如多个 pdf 文件对应一个 org,或者非常庞大的 pdf 文件要如何处理等等,先在这里谢谢了 :hugs:

3 个赞

非 evil 用户,但是工作中特别依赖 pdf-tools。

我这边用鼠标选中就可以选中文字 (mouse-set-region) 从而进行下一步操作。

org-noter 是单独一个包,把笔记全部外置在一个 org 文档中。我目前也在逐渐去完善用 Emacs 阅读 pdf 的工作流,不过我自己觉得比较不一样的东西是:我用 Info 来作为一个入口。所有的 Pdf 文档笔记,借用 org-noter,全部用一个 org 文件来保存笔记。

我也是在慢慢探索之中,不过目前看来还是可以去实现,当初在这个论坛的第一篇帖子的期望:像 Mendeley 一样管理所有 Pdf 文档, 也在不断地接近。

就单个 Pdf 文档性能而言,我完全可以接受现在的状态, 单个 pdf (134 MB 或者 1000多页) 的手册完全没有太过卡顿的感觉。当然了一些小技巧也可以帮助快速跳转: 比如把目录局域网保存在 Org-noter 笔记文件中。

当然了,说到标注,pdf-tool 在这方面还是比不过专业商业软件,比如我超级习惯在书上胡写乱画,我发现 Drawboard Pdf 在 Surface Pro 上 是更好的选择。当然了, 取长补短,用同步盘来处理这方面的关系,想必大家都有自己的理解。

反正,我是越来越离不开 Emacs 了。

我其实是想知道有没有办法单纯用键盘就选择文字呢,感觉用鼠标还是不太舒服。

手写确实是更符合直觉的做法。不过我最近刚把电脑装上双系统换成了 linux,现在唯一还需要 win 的就是 onenote 和 drawboard pdf 这种可以手写的应用了。如果 emacs 的 pdf 功能足够强,我其实是想把电脑彻底装成 linux 的 :joy:

以前在 iPad 上用的 marginnote 就非常的强,原理大概就是在 pdf 中每标注一段文字都会自动成为 outline 文件的一个子标题,然后只要在 outline 中手动调整每段文字的层级就基本完成了笔记整理。只可惜这个软件是苹果系统独占的,要是 emacs 也能实现就好了。(感觉上好像实现起来没那么难 :laughing:

同感。就因为要用margin note,所以打算用ipad当生产工具。自然而然只能在terminal下使用emacs了。如果emacs可以实现,我就不用买贵的ipad,也可以用X的emacs,会好得多。

在 pdf-tool 里全键盘操作,还希望论坛里高手点拨。

个人觉得倒不是特别大的问题,这可能和我的读书习惯有关系。读非编程类书籍的时候,我更习惯从头到尾读一遍。这期间,也就是第一遍,我会在 Surface Pro (SP)上完成,这期间天马行空的笔记只有这些手写应用才能胜任(主要是满足胡写乱画的欲望)。读完一遍之后,我会在 Emacs 中,借用 org-noter, 把重要的地方再标记出来。便于日后温故。

所以对我来说,主力电脑不需要这种手写应用。因为在第一次阅读的时候,我已经做了足够的“笔记”。我之前有过这样的顾虑,所以把 SP 和主力电脑的剪贴板共享在一起,实在要手写的时候,用 org-download 来解决。但是,一段时间的观察,我发现自己并没有很高频地用到这个功能。

至于 iPad 的 margin note 因为没有用过,希望有同时用过 SP drawboard 和 iPad margin note 的同学分享一下。我自己当初在选择 SP 和 iPad 的时候,主要是考虑到了 Emacs 的问题。 Win-10 下 GUI Emacs 是我特别想放到自己背包里的程序。

时间到了2019 年 10 月, SP 要出 Surface Pro-X, 已经长草。

1 个赞

我阴差阳错下 iPad 和 sp 来回倒手了三四次 :rofl:,现在因为换了 linux,又想把手中的 tablet x1(与 sp 类似)换成 iPad 了 :joy:

说实话,其实 drawboard pdf 的体验我觉得很一般,完全是因为 sp 上其他 pdf 软件更一般我才用的。具体表现在:

  1. 功能并不丰富,主要功能其实就是在 pdf 上手写。
  2. 结果手写体验还不好(跟 onenote 一比,差距就很明显)
  3. 不提供笔记本功能就算了,搜索批注的能力也很差。

我在想,要是实在没有用纯键盘在 pdf 里做标记的方法,我干脆用键盘模拟鼠标算了 :joy:

至于把标记的文字自动复制到 org 里,感觉上不是很难实现,到时候用我现学没几天的 elisp 知识试一试。

当然还是希望各路大神能帮忙实现下(

现在Emacs里面浏览PDF插件,EAF PDF插件已经是最强大最流畅的了,可以基于EAF开发PDF标注功能,因为EAF PDF插件是用 pymupdf 这个库开发的, mupdf 本身就很容易做出标注功能。

希望熟悉 PyQt5 同时对这个功能有强烈需求的大神们一起来开发。

1 个赞

最近在肝manuscript暂时没空搞。。。所以那个org-noter的项目暂时停工中。。等过一俩月应该还能捡起来。。

pdf-tools选择文字应该还有种办法是直接搜索对应的text 但可能并不是很方便。。

希望eaf也能支持djvu文档阅读

mupdf支持,可能就是elisp的扩展名没有加,加了就可以

加了一个补丁,有空的时候可以帮忙测试下,谢谢

1 个赞

之前有在 OneNote 插入过 pdf 当时感觉有点卡,今天特意再尝试了下。

  1. 功能并不丰富,主要功能其实就是在 pdf 上手写。

个人来讲,其实我就是在寻找一个能把手写 pdf 做好的程序,功能不丰富对别人来讲可能是一个弊端,但对我来说,这反倒是一个优势。

  1. 结果手写体验还不好(跟 onenote 一比,差距就很明显)

目前我在 DB 上发现仅有擦除功能和 ON 的体验有一点差距,具体来讲是就 DB 上擦除笔记的时候有一点延迟,而 ON 上则非常顺滑。

  1. 不提供笔记本功能就算了,搜索批注的能力也很差。

我没有用 ON 做笔记本,而是在一系列 *.org 中当笔记本,批注的搜索,我是在二次阅读, pdf-tool 中,借助 org-noter 来完成。 而搜索则是用懒猫的 snails 专门来做。我不知道现在的 OCR 技术发展到什么程度了,我的手写笔记,估计只有我自己能看懂,但是我还是希望,那些天马行空的笔记留在书中。

目前来看,ON 是有劣势的, 插入 pdf 如果用 Insert as printout:

  1. pdf < 50MB
  2. 导出 pdf+自己笔记的时候非常慢
  3. 首次加载时间非常慢

前两点, 目前对我来讲, ON 是无法替代 DB 的。

恩,我在 win 上用的也是 DB 呀 :rofl: ,ON 的 pdf 功能确实太差了。

我只是想说,单就 pdf 笔记功能的话,iPad 上会有更好的应用。DB 的手写体验至少对我来说很难受。主要体现在擦除和移动笔记的时候,不是时时预览的,这就导致擦除的时候很有可能一次擦不干净。移动的时候无法一次移动到位。而这些在 iPad 上都是有非常多的 APP 可以轻松做到的。

iPad 和 Surface 是两款定位不同的产品,在此我们就只讨论 SurfacePro drawboard 和 iPad margin note 两款软件的功能。 虽然SurfacePro drawboard 和 iPad margin note的定位也不尽相同。前者是PDF浏览软件,后者是知识管理软件。

首先要明确使用场景和使用目的。

从2012年的初代 Surface Pro 到 2016 年升级的 Surface Book,我基本没有在移动场景使用 Surface,手写功能主要的场景为:

  1. OneNote 记笔记,以及深度阅读PDF文件(教材、非虚构类书籍等)
  2. DrawBoard 浏览、标注PDF:比如手册、乐谱等

DrawBoard是一个优秀的PDF浏览器,浏览和标注体验都很流畅,但是它只能进行知识管理中的输入环节,建立知识的联系、整理笔记、进一步探究它通通不擅长。因此需要深度阅读的PDF一般都直接导入到OneNote,虽然不是以单文件存储不够优雅,但是OneNote的标注、搜索、笔记、链接等功能是真心强大。

2017年 iPad pro 10.5 上市的时候,我觉得正好可以用它完善现有的学习流程,扩展使用场景,所以在圣诞价格合适的时候入手iPad。此后,我的主要阅读环节都转移到了iPad上(除了会用SFB看乐谱)。我考察过MarginNote之后,觉得在当时的ipad生态系统以及小屏幕中,在ipad进行后续的整理难以实现,如果依然在电脑端进行整理的话,可以导出为通用pdf格式的软件更合适。这个时期我的工作流大致是:云盘 - ipad - Pdf Expert 阅读标注 - 云盘 - Emacs pdf tools 抽取笔记 - Emacs 整理。

2018年,单位给配了mac,因此尝试把阅读软件切换为MarginNote,后续的一些知识内化过程也转移到MarginNote。现在的工作流大致是:云盘 - ipad - MarginNote阅读标注 - 云盘 - Mac MarginNote 整理 - 将MarginNote的OCR文本或是外链整理到Emacs

综合而言,drawboard 是一个优秀的pdf阅读器,虽然在体验上赶不上 ipad 上的pdf expert等软件,包括手写的顺畅度、Surface本身的发热,但是功能够用,可以跟windows其他软件配合。 MarginNote 是一个优秀的知识工具,就我所知,目前没有同类的成熟竞品。但是如果没有Mac桌面端的话,由于其封闭的格式,想在ipad、windows、Linux上进行后续整理都不太方便。如果你经常读的是文字版PDF,那么除了MarginNote,应该也可以Hack出不少方案;如果是扫描版PDF的话,MarginNote可能是当下知识管理的最佳选择了(当然,只是用作阅读的话,选择很多)

让擅长的软件做擅长的事,然后让所有活动连接流动起来,而emacs的开放性使得它是最适合成为联结中枢的角色。

4 个赞