演示:
最近看书的时候发现一些pdf书籍目录不规范,受EAF启发,用Pymupdf写了个处理脚本与Emacs配合使用。
需要:
- 下载 yuchen-lea/pdfhelper 脚本
- 依赖 pymupdf 以及 python3
- 该脚本为命令行工具,可以独立使用
- 将 yuchen-lea/org-noter-plus: Extract outline and annotations to a Org-mode note from PDF and EPUB files. 更新到最新,设置 org-noter-plus–toc-script 为 pdfhelper.py 路径
- 在pdf-tool中调用 org-noter-plus-export-pdf-toc,导出大纲为org-mode,编辑后执行 org-noter-plus-import-pdf-toc,写回原PDF。org-mode的格式参见 yuchen-lea/pdfhelper
另外,目前在尝试把org-noter-plus的原功能用python实现。在pdf笔记较多时,提取图片费时卡进程,不太方便。async 调用python脚本是一个workaround。