还在为邮件列表流量太大而烦惱吗?

前几天发现了个有趣的工具, https://directory.fsf.org/wiki/CRM114

主要作用是用来区別 Spam,也就是广告邮件,但是因为它本身只是个带 machine learning 功能的文本处理语言,没有內建针对 Spam 的规则和数据集,全靠用户自己调校,所以用的好的话也可以用來做其它种类的分类。

比如我从 emacs-devel 的邮件里只练了十来个样本,训练出的数据就可以区分出哪些是提 bug,哪些是发布新 feature 了。

有兴趣的话我可以详细写一下。单纯看语言本身的话,我覚得比较像 SNOBOL。

5 个赞

顺带说下我原本是想找个 sieve 语言的替代品,因为 mailutils 的那个在 OS X 上没法加载扩展。