clsty
1
浏览器自带的保存网页功能会存储一个 html 文件与一个同名文件夹,管理起来很不方便,而由 SingleFile 得到的则是一个单独的 html 文件,其中已经包含了图片等资源文件,非常便于使用。
然而,在本地保存了大量由 SingleFile 下载的网页后,查阅管理它们就相当麻烦了。
对此,我设想过的理想工具是这样的:
- 自由开源
- 提供 Docker 容器,本地部署,可由局域网中的其他设备访问
- Web 界面(这样对 html 文件的渲染有天然支持)
- 每个 html 文件都对应一个 url 方便在笔记软件等地方引用
- 支持全文搜索
- 支持将 html 文件放到不同目录下分类管理
- 支持从 Web 界面管理/移动/删除/重命名/上传/下载等
不过,我仍未找到这样的理想工具,而最接近的工具可能也只有朴实无华的文件管理器了。
1 个赞
wsug
2
我首先的想到的是零网zeronet,应该是管理起来比较方便的。除了这个就想不出其它了
1 个赞
clsty
3
谢谢。我去看了一下,不过这个似乎不是为管理本地 html 文件而设计的。
我没仔细看,但它最大的问题可能是不光局域网内能访问,整个世界都能访问。
yibie
5
用 denote,配置 denote 的时候将 html 作为文件类型注入,然后你就可以通过 dried + denote 方便地修改文件名字,以及用它检索对应的文件。以及,它也可以直接将文件路径作为 link 输入。
至于阅读,我记得 eww 可以直接打开 html 文件(eww-open-file),你可以 advice 一下,指定 html 这类文件在 emacs 里使用 eww 打开。
1 个赞
lucene + tomcat? 自己写一点点代码。
1 个赞
clsty
7
这个方法不支持管理与全文搜索,不过它确实能代表一类思路,即使用 http 服务器做一个 index(Nginx 和 Caddy 等在这方面可能更常用)。
虽然不是我理想的方案,看起来也是很不错的样子。
有道理,如果实在没有所需的工具,那确实是要自己去实现了,只是需要时间折腾。
这基本上就是典型的文献管理的范畴了,可以看看 zotero。
我是用 singlefile 下载大量的 html, 用 marksnip 下载大量 md, 但这种网页型文献基本只是搜集备用,没必要精细管理。因此我不用 zotero 管理这些,就是通过类似杜威十进制法建目录树分类存放而已。真需要检索的话用 everything, 甚至 rg 来。
1 个赞
mmtun
9
我也推荐用Zotero。对于看到网络上比较好的文章要保存下来,我用的是Zotero的Connector。安装好浏览器插件后,就可以一键离线导出到zotero(保存snapshot)中备查。
保存到wayback machine ,到internet archive检索。
网页是为了把内容呈现到互联网上而不是浏览器里面设计的,没必要塞本地。网页内容丢失了,那就是死了,你只能保存它的印象,保存不了它的本质。
wsug
11
就是因为内容会丢, 所以才要存本地。 有时看到某些内容, 会预感不久就会消失, 没法找着了. 基本只有存本地这一个办法, 我开始想到zeronet就是因为他是不会丢的, 只要还存在一个用户