前段时间deepseek用着没问题,就是这几天爆了,开始卡。
你说的用r1 作 architect,sonnet写。是在aider中配置俩模型么?我看文档说可以配置不同模型做不同的事。但没试过。
否则的话,得先用r1启动,然后退出再用sonnet启动?
前段时间deepseek用着没问题,就是这几天爆了,开始卡。
你说的用r1 作 architect,sonnet写。是在aider中配置俩模型么?我看文档说可以配置不同模型做不同的事。但没试过。
否则的话,得先用r1启动,然后退出再用sonnet启动?
是的,就是这样。
能否这样:
先给一次完整的文件。
然后根据用户的注意力,让它给出局部某个函数的补全。
每次都根据用户的注意力,问它某个函数的补全。
文件改动太大之后,再给一次完整的文件。
…
有没有可能作成一个独立的程序。类似aider或者lsp。emacs接入,其他编辑器也可以接入。甚至通过低级操作接口,手动都可以用。最大化应用范围。
其实aider本身就很不错了。但它的思路好像是完全去掉编辑器,没考虑如何和编辑器配合集成。
其实核心还是要有专门的数据来微调模型和推理框架。
具体可以看 fireworks 发的这篇 blog,看下他们是怎么做的 :
How Cursor built Fast Apply using the Speculative Decoding API
还有这篇 openai 的文章:https://platform.openai.com/docs/guides/predicted-outputs
我觉着这是两个问题,一个是调用模型,一个是模型。
模型的能力问题只能等,等到大模型再进化进化,训练成本低到个人可用的时候,或者哪家公司提供。
我今天晚上仔细思考了一下,我觉得 cursor-tab 其实做个破产版的还是可以的。目前做这个最好的模型是 gemini-flash。他的输出速度 150 tokens 每秒,做这个其实是勉勉强强能用。
我的思路不是 avante 的那种让 llm 输出一个 json ,然后这个 json 是一个列表、每个 entry 包含了要编辑的行号和插入的文本。这个指令太复杂了。而且 json 格式一旦请求超时了,就没办法形成一个完整的可以解析的格式。
其实我只需要给 Gemini 两次文本,第一次是一个较长的上下文,第二次是再给 gemini 光标附近上下几行的代码 (不宜太长,也就上三行下五行左右。再长的话输出速度就跟不上了)
然后我让 gemini 直接把它对光标附近的代码修改后的结果进行完整的输出,就可以了。然后就可以合并这个 diff。这样做的好处也包括:如果请求超时了,因为不要求 json 格式,不完整的代码也不会导致解析失败,可以用来合并。
用哪个模型让用户自己选呗。有钱就能有最好的效果,没钱不用都可以。