hauka
2026 年6 月 13 日 09:38
1
起因是之前看到了 Claude 打异星工厂 。虽然也才刚刚到红瓶半自动化(而且还没做完),但是也是惊人的能力。虽然以 Claude 现在的能力不太像是能拍出什么正常的工厂布局,但是一年前 Claude 还是这样:
AI 对于代码的理解能力在某些时候依然让我震惊 (反向) - Programming - Emacs China
或许再过一年就有游戏领域的通用人工智能了呢?
但是从另一个方面来讲,异星工厂的工厂布局不止和能否产出足量物品有关,还和美感有关,比方说有人喜欢电线杆对齐,有人喜欢填满厂区里每一个空格之类的。而且异星工厂还有打虫子这种高实时性的任务(暂且不谈遇到战斗会不会降级成 Opus 的问题),以及飞船设计、变质物管理、电力建设、品质、插件、火车、电路……这些都是通用人工智能可以完成的吗?
cireu
2026 年6 月 13 日 18:59
2
感觉现在的新模型全都往代码方向卷,反而普通对话的效果有所下降。可能是因为目前只有写代码方向找到盈利点。
2 个赞
hauka
2026 年6 月 13 日 19:34
3
好像人工智能最能大规模应用的地方只有编程了,图像生成可以本地部署(虽说效果不太行),音频生成更简单,写作的份额让 deepseek 抢光了。数学、物理、生物研究等可能和编程是相通的,也就那几家有编程能力的模型能干。是因为都需要推理能力?规划程序框架可能还需要一定的数理直觉?不太清楚。还有视频生成,但是好像只有字节和快手能干。
说到视频生成,视频生成方面应该更容易卷才是。Seedance2.0 都多久没更了,甚至还降智了,居然都没人能赶上,让字节爽吃一年半。四月份 openai 的 sora 挂了,估计是赔了不少,虽说效果比不上 seedance(毕竟字节可是有抖音的公司),但是至少能让字节吃相好看一点。谷歌明明有油管,做出来的 gemini omni 跟屎一样,还比不上人初创公司 openai 呢。听说 gemini omni 刚要出的时候字节还被吓到差点发布 seedance2.1,效果一出来人直接给价钱再提升一档了。
视频生成这么赚都没人来抢市场,只能是技术原因了。所以新模型往代码方面卷应该也是技术原因:此前模型都是文本模型,给后人留下的知识也是文本模型的知识;恰好文本模型所需的推理能力可以用于编程,所以新模型往编程方面卷是最简单的路。
wsug
2026 年6 月 14 日 04:03
4
能批量生成效果不差的视频,总感觉有这个技术能力的话,那些人会直接做虚拟现实,元宇宙,还在做短视频就说明没有这个技术能力
大概在两年前就能做了,就是所谓世界模型。还在做短视频是因为手机已经人手一部,VR压根没普及,商业上划不来
我倒是觉得还早。还是一个准确度的问题,LLM 给出的答案我没办法信得过。
hauka
2026 年6 月 14 日 09:43
7
我觉得这应该是经济原因 字节一家独大 没必要烧钱和自己抢份额
我觉得主要是文本模型有一大堆中国公司开源,所以卷得比较凶。现大模型也只剩美国的闭源模型和中国的开源模型在玩了
1 个赞
看来你没怎么关注大模型前沿方向,不知道中国的闭源模型,欧州的开源模型,拉美的千问微调。
wsug
2026 年6 月 15 日 12:49
10
这个问题我总感觉是因为很多模型不支持中文,所以就选择性的忽略掉,能做到支持中文的不多,基本都是国内公司,所以感觉上是就这么几家在玩
另外虽然支持中文,效果其实比英文差,但现在一些中文模型好像学聪明了,知道你长期在国内,用英文问问题也用中文回复避免你发现这一点
acoret
2026 年6 月 16 日 02:57
11
并没有哦 并不通用 只是人类看上去比较通用 特攻人类,如果是通用那它在底层上必然有一个稳定的逻辑在,目前还是文本模型,只是使用文本就足够索引到人类的知识图库了 反映出来就像是有了通用智能
====
换句话说 如果你认可生命游戏里的是生命 那 你也能把这个当成通用智能🤣 都修改定义了 怎么不能当呢
这三个概念很容易让人混淆:workflow LLM AI
我感觉现在大部分人谈论的所谓ai或者agi(包括你视频里的这个)都是有LLM特色的workflow自动化工作流
建议看看gnu官方的观点:需避免使用(或谨慎使用)的词汇
还有就是通用人工智能这个东西,要如何定义它都是存在一定争议的,毕竟杨立昆好像是认为通用型人工智能本身就是个伪概念
上个世纪50年代的时候大家也这么想过. 现在对 AGI 的很多想象其实就来源于那个时代, 比如阿西莫夫那一批科幻小说. 那会儿 mainframe 的算力都不一定比得上今天一台智能洗碗机. 这么看现在大家的想象力相对那时候可能还更保守了些.
这次肯定是接近了不少, 不过从模型结构, 训练方式以及算力这些角度看, 个人觉得最近十年实现 AGI 的可能性也不大.
目前更像是一种软件工程领域的范式变化, 类似 fortran/c 代替汇编这种. 写汇编的老师傅会失业, 但后续编程体验会好一些, 写软件的门槛会降低. 不过可能的区别在于 fortran/c 之后软件行业的市场容量是增加的, 少数人失业的同时, 投资和总就业在增加, 这次会不会这样就比较难说.