突发奇想：用 Geiser 写一个 Emacs NewLisp REPL？

LdBeth · 2017 年6 月 1 日 10:18

NewLisp 是一种脚本解释型的 Lisp 方言，特点是默认使用动态作用域（Dynamic Scoping），和 Scheme 类似的 define 过程定义，超快的运行速度（在脚本语言中算顶级），极度轻量化（600 KB 出头，低于大多 Scheme 实现），强大的调用动态链接库能力。

NewLisp 官方的 IDE 居然是基于 Java 的。有点无语。

然而，我发现 Emacs 上只有个 newlisp-mode。然后这个作者自己搞了个功能有限的 swank-newlisp。

所以我现在正在看 Geiser 文档，准备改造个 REPL 出来。Geiser 默认同时支持多种 Scheme 实现，比 SLIME 稍微友好一点，有很多能利用的宏。看起来 NewLisp 是能用 TCP Server 的形式和 Geiser 交互的。跳转啊 DEBUG 啊也是靠预先定义的命令字符串，都是高度可适应的。最模糊的地方可能就是补全。就是怕 Geiser 的作者看到我用 Scheme REPL 搞 NewLisp 会把我打死。

可能稍微要参考下那个 Java 的 IDE。

大家有什么好的想法嘛？

kuangdash · 2017 年6 月 1 日 12:57

想法是 elisp、clojure 或者 racket。

然后，编程这个事，第一步还是先掌握原理和算法思想（当然这里开始可能就要考虑机器结构以及平台结构了），然后才是具体的语言层面、机器层面的实现。

你来提问就说明你对之后要做的事有点恐慌。

emacs-china 上有个我遗留的未完成事项：EGO 2.0 计划 · Issue #91 · emacs-china/EGO · GitHub

有兴趣可以试一下:grimacing:

LdBeth · 2017 年6 月 1 日 13:29

上 NewLisp 这个小众的小众是因为喜欢 Emacs Lisp 的动态作用域，又想要个轻量脚本解释器。

角色扮演编程流派的我也就只会组装工具思维。从头造起就有点虚了。

主要是没有更博客的心就没有重写 EGO 的心啊

大家都是这样我就放心了。

我静态网站生成没太大兴趣啊。

kuangdash · 2017 年6 月 1 日 14:06

轻量的脚本解释器用 shell 就不错，用 NewLisp 可能就过于复杂了。

编程语言实际上是构建在人与计算机之间的通信协议，很多编程问题看似工程问题，实为社会问题，我以前也考虑过 NewLisp，但是受众不多，难以推广。而 emacs 能用 elisp 造出如此多有趣的功能很大程度上也源于它的社区，另外 elisp 也能当作脚本。

EGO 2.0 是个整体性工程，用组装工具的方法已经不合适了:sweat_smile:

LdBeth · 2017 年6 月 1 日 14:22

说到社会问题……又想起了当初 Emacs 作者们忽悠他们办公室的秘书说用 Lisp 写 Emacs 扩展不算编程的事。

我要做的就是把他们做过的再做一遍。可惜那时候人多淳朴啊，现在都不好直接忽悠了。

所以每个用 Emacs 的人都是社区的宝贵财产啊。

kuangdash · 2017 年6 月 1 日 15:00

EGO 2.0 要是能如计划完成，那么它在 Emacs 社区里的效果应该不亚于 hexo 在 node 社区里的效果吧

org-mode vs markdown S-exp vs yaml

作为一个横跨了 emacs 和 web 浏览器前端的桥梁，用它来做大新闻应该说是挺不错的

不过我目前对前端和 emacs 都算手生了…

LdBeth · 2017 年6 月 1 日 15:14

我有一个大胆的想法（请开始你的表演）。

用一个 Org 文件和一个类似 blog-admin 的提供管理按键的子模式来管理源文件和生成的文件。每个文件下方生成属性。通过 TODO 状态来处理 Publish 状态。保存以后开始处理文件。

然后我觉得用 pandoc 作为可选的导出后端也不差。因此能增加几个 markup 语言的支持，何乐而不为？

kuangdash · 2017 年6 月 1 日 15:39

Org-mode 提供的接口有几个问题：

org 文件内容和 org 文件的属性信息（譬如说作者、文章标题等等）放在了一个 org 文件里，这样要提取 org 文件的属性信息就必须载入整个 org 文件；而 hexo 管理 md 文件的方式则是将 md 文件的属性信息放在另一个 yml 文件里，这样在只需要文件属性的场合，只用载入小小的 yml 文件就好了
org 文件作为结构化（就是嵌套）文本格式是有缺点的（这个缺点详述就有点麻烦了），所以不适于用于 xml、yml(yaml)、json 和 S-exp 等结构化配置文件的场合，但是怼 markdown 这种简单标记文档格式还是合适的

而 blog-admin 的问题则是要兼容多种后端搞前后端分离，但是实际上应该算是 ctable 结合 f 在管理文件列表上的一个应用，但是由于深入到了 export 层面，这就要面临融合各种后端 export 方式差异的问题。而在我看来，这种融合基本意味着对后端 export 功能的省略，而且 EGO 2.0 有一个即时预览 html 文件的要求。

至于 pandoc——用它意味着要连带一整套 haskell 环境，这个代价太大了，而且 org 对多格式导出的支持已经算非常不错了。

LdBeth · 2017 年6 月 1 日 16:14

前两个问题，如果有一个简易 indexer 用匹配的方法提取重要信息写入一个 lisp 格式的目录文件就可以解决了。各种标记语言和 Lisp 比较就显得累赘而不易读。不管用纯 Lisp 还是为了考虑速度用别的脚本都没关系。甚至用 go 来个 binary 也行。

实时预览我不算了解，是写入到临时目录里面吧？但是用 vmd 的经验让我觉得 Emacs 不太适合完全搞实时的，太耗性能。把生成文件钩在手动保存／自动保存就很好了。当然这个做成可选的就差不多了。

blog-admin 只是把生成 html 和推送交给后端了，文件管理都是要自己实现的。

Pandoc 只是作为一个命令行的后端。有其他干净的选择当然可以。我觉得 Emacs Lisp 还是安心当胶水比较好，如果生成站点的时候宕机了就尴尬了。不管怎样，把后端接口留给用户总是好的。

我还是喜欢那种 Blading fast 的体验，Emacs Lisp 还是负责对速度没要求的部分好。（看了下发现不少静态网页生成都用 pandoc，看来用这个当后端的确没什么特色）

kuangdash · 2017 年6 月 1 日 16:29

lisp 格式的文件通常就叫 S-exp 了

[quote=“LdBeth, post:9, topic:3043”] 把生成文件钩在手动保存／自动保存就很好了。 [/quote]这样也算一种实时吧，可以看下 org-iv，就是这样实现的

elisp 用的好也是很快的……不好意思，最后这个帖子全歪了:grimacing:

mayingjun · 2017 年6 月 2 日 01:53

一直找不到newlisp ide之类的工具，支持楼主的做法。

LdBeth · 2017 年6 月 2 日 03:36

看了看指南学了一下。果然是梦幻级别的语言。感觉这个比 Scheme 还要简单。

xuchunyang · 2017 年6 月 2 日 05:36

就生成静态页面而言，速度影响不大，比如我的网站就用的是 Emacs 生成的（配合 Nanoc 和 Org mode），不算缓存，从头生成整个站点需要 1.56 s，换成 Pandoc 估计能节省一秒钟，但影响不大，只要不是太慢就行。

~/src/xuchunyang.me (master *)$ nanoc
Loading site… done
Compiling site…
Starting Emacs daemon.
0
      create  [0.93s]  output/blog/2017/06/open-file-with-local-emacs-in-ssh/index.html
0
      create  [0.07s]  output/blog/2017/06/send-email-from-command-line-with-emacs/index.html
0
      create  [0.12s]  output/blog/2017/05/use-nanoc-with-org-mode/index.html
      create  [0.01s]  output/feed.xml
      create  [0.00s]  output/htmlize.css
      create  [0.01s]  output/index.html
      create  [0.00s]  output/main.css
      create  [0.00s]  output/main.js
      create  [0.01s]  output/sitemap.xml
      create  [0.00s]  output/tags/emacs/index.html
      create  [0.00s]  output/tags/nanoc/index.html
      create  [0.00s]  output/tags/org/index.html
      create  [0.01s]  output/tags/emacs/feed.xml
      create  [0.00s]  output/tags/nanoc/feed.xml
      create  [0.00s]  output/tags/org/feed.xml

Site compiled in 1.56s

frapples · 2017 年6 月 2 日 14:54

奇怪，真奇怪，你怎么会喜欢动态作用域呢？你是不是elisp写多了。。。

实际上，动态作用域是已经扔进编程语言发展的历史垃圾堆的东西了，emacs-lisp是历史遗留问题。我写elisp还喜欢用lexical-let呢

elisp作为一个早期的lisp，其实缺点很多。在这其中，动态作用域是硬伤。

至于现代的比较完美的lisp，可以参考scheme。

LdBeth · 2017 年6 月 3 日 02:10

自由的代价是要处处小心。

我的意见是，至少得问问我要不要用动态作用域这个有时候很方便的东西。elisp 做的很好，是可选的。虽然这是为了兼容依旧代码以及有些时候闭包还是有点问题。

在NewLisp里，比如某些时候：

(define (foo) 1)
(define (bar) (+ 2 (foo)))

(bar)
;; => 3

(let ((foo (lambda () 2)))
  (bar))
;; => 4
;; 在 Scheme 里面就会是 3

很方便的局部重定义函数。而且有命名空间的配合，动态作用域还没指针可怕。

这篇文章介绍了 NewLisp 的特点：

http://m.oschina.net/question/565376_62226

其他包括引用未赋值的变量不会报错，只会返回 nil；能直接引用动态库；使用唯一引用内存管理来避免垃圾回收地狱，而且因此只需要一个 eq 操作符就能判断是否相等。作为脚本引擎，加载配置和运行脚本的区别只在于有没有声明 (exit) 。

frapples · 2017 年6 月 3 日 14:47

非常抱歉，我不是很赞同你的一些看法。

引用未赋值的变量不会报错

这是一个很不好的设计，因为会导致大量的变量名拼写错误无法暴露出来。

使用唯一引用内存管理

也就是说变量其实是值类型对吗？那篇文章说没有垃圾回收器，那为什么不需要gc呢？首先这个语言一定能表达链表对吧？能表达链表一定就能表达环形链表，就会出现环形引用，出现环形引用要么手动管理内存要么用gc解决。

最后谈一下动态作用域。你的示例代码，看似很方便，但是请注意，这会使得一个函数依赖的符号变得非常非常多，函数的行为变得很不可控。你根本不清楚更高级的调用者是否重定义了函数的依赖的符号。

如果想达到演示代码里的这种效果，简单一点的方法是使用全局变量来定义需要改变的那个符号。更好的方法，是把需要改变的符号从参数传入，或者放到某个数据结构里去。

那篇文章说采用动态作用域是因为性能好。。。我不是学PL的对这个结论不太清楚。个人的看法是，首先，为了一点儿性能牺牲使得代码更不清晰不是很值得；其次，如果是编译语言的话，编译器在编译器有充足的时间去优化那一点儿性能损失；如果是解释型语言的话，解释器语言从来都不在乎那一点儿性能损失。

我看了一下那篇文章，觉得：

f表达式与求值

lisp的宏没什么经验，这个感觉是一种使用正则序求值的函数，直觉告诉我这个特性还是不错的。

frapples · 2017 年6 月 3 日 14:57

这篇文章详细的讨论了动态作用域和词法作用域： http://www.yinwang.org/blog-cn/2013/03/26/lisp-dead-alive

作者是专业的PL出身，因此他对此的观点很有参考性。

LdBeth · 2017 年6 月 4 日 05:22

看过这篇啊……应该说我发主题之前还看了一遍，发这贴的时候也看了一遍。当初就是看他早期的博客被安利了 TeX 和 Lisp。不过众所周知王垠是 Elisp 黑，Shceme 粉。这个是由个人经历个人喜好决定的，就和有人爱 iOS，有人爱 Android 差不多。

我觉得有必要重新审视下动态作用域的优点。这好歹算是 Lisp 的特色了。

未赋值的变量不会报错，主要是为了减少写参数列表的麻烦。在NL甚至可以这样：

(define (foo x y , p v) body...)

其中逗号用来在视觉上分隔必要参数和局部变量。实际上逗号也是被当作正常参数处理的。

然后就省去了繁琐的 let 结构。

为什么不需要垃圾回收，是因为没有联系到符号的内存在表达式求值结束后立马被清理，而不是被标记以后等着被回收器处理。

然后 NL 应该不支持环形引用。它不支持 cons cell （它有个 cons 函数，但只是用来把两参数组合成列表。），而据我所知 CL 或 Elisp 都是通过 cons cell 实现环形引用的。Shceme 我不了解。能否给个 Shceme 的例子？（我拿 guile 跑 Elisp 的例子，却 Loop 住了）

解释器语言一点都不在乎那一点性能损失。

这话说出来……有点道理。CL Scheme 乃至 Elisp 都是能用编译器优化的。

你反驳的点，我理解为 “不安全，不可控”。不过 NL 本身并不是设计成过于通用的语言。在 NL 设计的应用场合，几百行层次的程序，有各种辅助机制下，动态作用域不会带来太大的困扰，反而可以 让程序更简练 ，和花几十行搞个数据结构，每个函数加几个只用一次的参数相比，我觉得有风险是值得的。就算有内存泄漏也有很多人用 C 嘛。

简言之，有动态作用域不会导致写不出程序，没有也不会导致多少麻烦。

frapples · 2017 年6 月 4 日 06:06

不过众所周知王垠是 Elisp 黑，Shceme 粉

你可以说它是微软黑，linux粉，这我赞同。但是王垠是专业研究programming language的，这篇文章可以认为他从专业的角度阐述专业的看法，用 “黑” “粉”这样的词概括恐怕有些不合适吧？

我觉得有必要重新审视下动态作用域的优点

从王垠的文章可以看出，PL专业领域已经评估过了动态作用域和词法作用域，现代的任何一门语言不约而同的选择了词法作用域（C++, java, python,j avascript, scheme, lua, 甚至php)，这是不是说明了什么？

未赋值的变量不会报错，主要是为了减少写参数列表的麻烦

个人觉得，为了少写一点点的代码，大大增加犯错误的概率和debug的难度，是很不划算的。想想为什么静态类型那么麻烦还要手写类型名称好麻烦，没有鸭子类型搞什么继承好啰嗦，却有很多语言采用？因为编译器能帮你检查出一大堆弱智的错误出来。

然后 NL 应该不支持环形引用

不支持环形引用。。。。。。为了内存管理而去阉割语言特性，不太好吧？例子很好举，一个数据结构包含一系列的元素，链表，vector，hash表都行。其中一个元素引用这个数据结构本身，就是最简单的环形引用。

在 NL 设计的应用场合，几百行层次的程序，有各种辅助机制下，动态作用域不会带来太大的困扰，反而可以让程序更简练就算有内存泄漏也有很多人用 C嘛

你也承认，由于动态作用域的局限性，NL顶多拿来写写几百行的小脚本而已。
几百行的小脚本，想让程序更简练，不花几十行搞个数据结构，并不是动态作用域的专利。我前面说了，使用 全局变量 也可以。
一些底层的需求只能用C的手动管理内存。可是动态作用域有什么非用不可的地方吗？而且，C++的出现也是在努力的尝试用更好的语言特性去降低内存泄漏，比如RAII。

简言之，有动态作用域不会导致写不出程序，没有也不会导致多少麻烦我的意思是，词法作用域比动态作用域要优秀的多。

LdBeth · 2017 年6 月 4 日 07:28

这个话题要等以下圣战有结果才能下结论。

静态类型好还是动态类型好
Ruby 好还是 Python 好
Scheme 是进步还是妥协
C or C++?
如何评价王垠（喂）

容易造成又一次大战。所以在论坛里的讨论还是点到为止吧。

不过我还是学到了不少东西，比如现代 Lisp 是靠闭包导出 AST 来实现编译的。 JS 可以模拟动态作用域。所以 NL 可以转译为 JS 。至于我原来的回复，还是私信里面聊吧。