25年我最希望能有个emacs ai 插件

前段时间deepseek用着没问题,就是这几天爆了,开始卡。

你说的用r1 作 architect,sonnet写。是在aider中配置俩模型么?我看文档说可以配置不同模型做不同的事。但没试过。

否则的话,得先用r1启动,然后退出再用sonnet启动?

是的,就是这样。

1 个赞

能否这样:

先给一次完整的文件。

然后根据用户的注意力,让它给出局部某个函数的补全。

每次都根据用户的注意力,问它某个函数的补全。

文件改动太大之后,再给一次完整的文件。

有没有可能作成一个独立的程序。类似aider或者lsp。emacs接入,其他编辑器也可以接入。甚至通过低级操作接口,手动都可以用。最大化应用范围。

其实aider本身就很不错了。但它的思路好像是完全去掉编辑器,没考虑如何和编辑器配合集成。

1 个赞

其实核心还是要有专门的数据来微调模型和推理框架。

具体可以看 fireworks 发的这篇 blog,看下他们是怎么做的 :

How Cursor built Fast Apply using the Speculative Decoding API

还有这篇 openai 的文章:https://platform.openai.com/docs/guides/predicted-outputs

我觉着这是两个问题,一个是调用模型,一个是模型。

模型的能力问题只能等,等到大模型再进化进化,训练成本低到个人可用的时候,或者哪家公司提供。

我今天晚上仔细思考了一下,我觉得 cursor-tab 其实做个破产版的还是可以的。目前做这个最好的模型是 gemini-flash。他的输出速度 150 tokens 每秒,做这个其实是勉勉强强能用。

我的思路不是 avante 的那种让 llm 输出一个 json ,然后这个 json 是一个列表、每个 entry 包含了要编辑的行号和插入的文本。这个指令太复杂了。而且 json 格式一旦请求超时了,就没办法形成一个完整的可以解析的格式。

其实我只需要给 Gemini 两次文本,第一次是一个较长的上下文,第二次是再给 gemini 光标附近上下几行的代码 (不宜太长,也就上三行下五行左右。再长的话输出速度就跟不上了)

然后我让 gemini 直接把它对光标附近的代码修改后的结果进行完整的输出,就可以了。然后就可以合并这个 diff。这样做的好处也包括:如果请求超时了,因为不要求 json 格式,不完整的代码也不会导致解析失败,可以用来合并。

可能可以試試看這個專案, uniteai.

Emacs LSP client:

我記得他的目標是有不同的後端支援, 也支援本地的 LLM.

1 个赞

用哪个模型让用户自己选呗。有钱就能有最好的效果,没钱不用都可以。

:+1: