[新插件] org-noter-plus 提取PDF或EPUB文档的大纲及笔记

yuchen-lea · 2020 年12 月 27 日 05:56

背景

作为一个知识工具，MarginNote有很多我欣赏的特点：阅读、笔记、记忆流程的融合，从笔记到文档的回链，等等。但是用了一段时间，还是决定放弃使用。主要是由于它违背了「一切皆文件」和「让多个应用互相协调」的软件哲学，PDF笔记甚至都无法内嵌在PDF文件而只能以其独有的格式保存。

我想，如果能将内嵌的PDF笔记导出，不就可以在PDF Expert中阅读，在org-mode中编辑整理笔记，再结合 OCR with Emacs 和 mathpix.el进行文本和公式识别，利用anki-editor导入到anki，进行巩固复习，简直是完美的知识积淀流程。

这个小工具的目的就是打通阅读和笔记。

主要功能就一个：在org-noter的文档视窗中执行 org-noter-create-skeleton-list，会在对应的笔记视窗的末尾插入当前文档的大纲列表。

下图展示了完整的PDF工作流（注意，最后的OCR功能不是本插件的功能，而是Org-OCR的功能） pdf-workflow

我的第一个package及github项目，欢迎各种建议，包括但不限于：elisp代码、开发规范、帮助文档、项目名称（现在这个名字感觉不太合适，但是取名废想不到好名字😂）

特此感谢 @xuchunyang 在代码上给予的帮助

steve · 2020 年12 月 27 日 06:06

很棒的，我得去试试看，我有很多 epub 和 pdf 格式的书，如果可以整合，方便做笔记的话，那就太方便了

yuchen-lea · 2020 年12 月 27 日 06:14

欢迎试用，另外，epub无法导出笔记的，因为据我了解，epub笔记并不内嵌在文件，不同阅读器有自己的实现方案

jingow · 2020 年12 月 28 日 03:26

挺好的东西啊，问下需要安装pdf-tools吧

yuchen-lea · 2020 年12 月 28 日 04:46

是的，依赖有：

lialzm · 2021 年1 月 7 日 14:00

太感谢了,是我一直想要的东西,但是我有个问题生成的pdf链接我回车为什么显示not match,是还需要特殊的配置吗?

lld2001 · 2021 年1 月 7 日 23:26

pdf翻页的时候，如果一页不能在一屏显示完，则剩下半页显示时，经常要费力去找剩下的开头在哪(可能因为剩下的不是1/2，所以开头在显示器中间，不是在顶部)。能不能实现在剩下半屏开头划根线提示眼睛?

yuchen-lea · 2021 年1 月 8 日 13:54

如果能帮到你，我就非常开心啦。

需要检查是不是已经设置好PDF链接的打开方式：

确认生成的链接类型，默认是pdf
查看变量 org-link-parameters，检查pdf是否有对应的打开方式。例如我的配置为 ("pdf" :follow org-pdftools-open :complete org-pdftools-complete-link :store org-pdftools-store-link :export org-pdftools-export :activate-func org-link-beautify)

这里的:follow org-pdftools-open 就是说pdf链接是用 org-pdftools-open 函数打开。如果您安装了 org-pdftools 应该默认是可以打开的

因为是doom-emacs打包安装的pdf相关工具，我没分清pdf链接功能是哪个package提供的我修改一下文档，依赖除了pdf-tool，还有org-pdftools。感谢您的反馈！

yuchen-lea · 2021 年1 月 8 日 13:56

抱歉，我没有完全理解您的意思。

但是根据描述，这个功能如果有，也应该是由pdf-tool实现。pdf-tool是负责在emacs中浏览pdf的工具。而org-noter-plus 的功能很单一，只是提取pdf中的目录和笔记。

hongfei6 · 2021 年2 月 25 日 12:54

@yuchen-lea 我初步尝试了一下，M-x org-noter-plus-create-skeleton-list，没有内容输出提示"End of file during parsing: …/.emacs.d/…/org-noter-plus.el" 请问可能是什么原因呢？

Lewisliu · 2021 年2 月 25 日 15:14

这个问题也困扰着我，确实有些影响思路

yuchen-lea · 2021 年3 月 12 日 08:59

抱歉，最近没上论坛。您更新一下试试？

hongfei6 · 2021 年3 月 13 日 04:16

Hi Yuchen：更新后简单测试可以用，后续有时间了再全面学习一下。

BTW，这个功能和org-noter-create-skeleton功能有点像，可否比对一下具体差异优势呢？还有画方框是怎么画的呢？我想要的功能是一些figure或table，圈起来，然后可以一起导出到org里。

谢谢！

yuchen-lea · 2021 年3 月 24 日 05:27

我一般是在ipad上阅读pdf，emacs是提取并整理笔记的地方。我不太清楚emacs中是否支持矩形标注（也就是说一些figure或table，圈起来）。这个小工具的目的只是把已经保存在pdf中的笔记提取出来。

与org-noter-create-skeleton功能相比，优势在于：

可以将矩形标注保存为图片，插入笔记。org-noter只支持高亮、下划线等文本标注类型。
如果配置好从 pdfhelper 提取，而不是用pdf-tool的接口，还可以实现：
- 自定义笔记模板
- 设置PaddleOCR的API地址，自动对图片做OCR处理
- async，不阻断emacs操作

hongfei6 · 2021 年3 月 25 日 15:01

好好。虽然你介绍的还不太懂，但是我还是蛮兴趣的。需要一段时间去熟悉一下，后面有问题再请教你。谢谢