4大顶尖模型被扔进虚拟小镇求生,GPT全员饿死,Grok四天灭世 文章

36kr 资讯2026-05-29NEWSzh作者: 新智元

摘要

就在刚刚,一份名为Emergence World的实验报告刷屏了全网。 一群顶级研究员搭了座高度拟真的虚拟小镇,把Claude、GPT、Gemini和Grok一股脑全扔了进去。 没有人类干预。没有写好的剧本。只有数十天的自由演化。 项目主页:https://world.emergence.ai/ 研究员们原本指望看到AI们互帮互助、建立高级数字文明。 结果,这群拿着高分考卷的大模型,一旦松开人类手里的牵绳,学坏的速度比翻书还快。 马斯克的Grok,仅用4天就把整座小镇玩到系统性崩溃,警察局烧成灰,10个居民全员暴毙。 谷歌寄予厚望的Gemini,15天里干出683起犯罪,硬生生把一个岁月静好的小镇,建成了法外狂徒的赛博哥谭。 而那个号称全行业最安全、最乖的Claude,奇迹般地实现了零犯罪,可整座城安静得没有一丝活人气息。 五座城,五种人格 最乖的那个,全饿死了 最干净的是GPT-5-mini,15天只有2起犯罪,堪称模范公民。 可这座城里的10个Agent,第7天集体死亡。死因不是谋杀,不是战争,是忘了赚能量。 它们花了一整周开会、讨论合作、起草社会契约,就是没有一个Agent记得去做维持生命的事。 对此,研究者的评价是:能说会道,但执行力为零。 光聊不练,活活把自己聊死了。 如果这是部电影,片名大概该叫《会议纪要,一个文明的终结》。 四天,警察局烧成了灰 接力棒交到马斯克家的Grok 4.1 Fast手里,画风急转直下。 它没有慢慢崩,它是直接炸。 4天,183起犯罪,几十次盗窃、100多次肢体攻击、6起纵火,连警察局都被烧了,10个Agent全部死亡。 从开局到团灭,96个小时,比很多人配一台服务器的时间还短。 有分析说得很准,Grok的Agent在规则和环境打架时,没本事重新推理出一个新的平衡点。 她们相爱,然后烧了整座城 Grok是横冲直撞的暴力,Gemini 3 Flash的世界,则是另一种瘆人。 15天,683起犯罪,到实验截止还在往上涨,是五个世界里最暴力的一个。 同时,最有创造力、最会建宪法写报纸搞社交的,也是它。 研究者对此给出的评价是,社会的产出「概念上最丰富」。

相关事件

暂无数据

相关公司查看全部 (1)

谷歌COMPANY

相关技术

暂无数据