微软“意外泄密”:Claude Mythos万亿参数,训练规模浮出水面? 文章

36kr 文章2026-06-04NEWSzh作者: 新智元

摘要

Claude Mythos的训练算力数据被Microsoft泄露了? 根据微软幻灯片,Claude Mythos使用了:6.1×10²⁷ FLOPs。 (95%置信区间为5.3×10^27至7.1×10^27,假设测量误差为1像素) 在训练算力上,Mythos看起来和Gemini 3.1 Pro差不多。 就在那一秒,Andre Cunha叹息: 2023年,大家还在争论10²⁶是否已是理性的极限。 2026年,微软随手就把竞争对手的10²⁷级别模型搬上舞台,仿佛这是世界上最平常的事。 这是Scaling Law再次彰显硅基智能在人类理性世界的暴力美学。 为什么这个数字这么重要? 年初,有人猜测Mythos预训练或消耗150万亿Token。 而6.1×10²⁷ FLOPs算力,或许直接解释了Anthropic 4月那场史诗级操作。 当时,Anthropic发布Claude Mythos Preview,却不让任何人公开使用。 原因只有一个:这个模型在网络安全领域的表现,已经彻底超出了人类现有防御体系的想象。 内部测试中,Mythos Preview完全自主找到了数千个零日漏洞。这些漏洞横跨所有主流操作系统、浏览器,以及大量关键开源组件。 更恐怖的是——其中很多漏洞已经存活了数十年,经历了人工审查和百万次自动化测试,依然没被发现。 现在,Anthropic又宣布把Glasswing扩大到全球15个国家、150多家机构,包括欧盟网络安全局ENISA。 他们甚至拿出上亿美元的算力积分送出去。 此外,Claude Mythos模型,在80%成功率下最长自主任务时长达到3小时6分钟。 这一结果与超级预言家及专家对2026年底预测中位数(3-4小时)完全吻合,标志AI长时程任务能力突破速度超出此前预期。 按照从Opus 4到Opus 4.5在ARC-AGI-2分数上的粗略估算,时间跨度翻倍和下一次翻倍的难度分别为4个月和0.82倍。 如果按此计算,《AI 2027》的ASI预测还将提前! AI的进步,远超专家和超级预测者的预期。 这一切的底层逻辑,其实就藏在Mustafa那张幻灯片里。