马斯克也拥抱C语言了,大模型训练堆栈抛弃JAX,提速一个数量级 文章

36kr 资讯2026-05-29NEWSzh作者: 量子位

摘要

不用JAX,SpaceX正在用C语言编写的全新堆栈训练新模型。 而且马斯克本人亲口承认,Grok 5已经用的就是这个新堆栈。 按马斯克的说法,这种新堆栈能让大模型训练速度提升一个数量级。 下一步,推理部分的堆栈也会用C语言重写。 同时,老马字里行间也没忘记炫耀自己手里的GB300,并为SpaceX招兵买马: 请注意,我发布此消息是为了鼓励那些希望从硬件中获得卓越性能的人加入SpaceX。 Colossus II也可能出租 效率在提,算力也在扩。 马斯克不只在软件层面卷效率,硬件端同样大力出奇迹。 SpaceX正在建造代号Colossus II的下一代超算集群,总功率达到1吉瓦,造价约170亿美元。 对比一下,xAI当初建Colossus I花了30到40亿美元,Colossus II直接把规模跳了一个量级。 算力扩张的同时,SpaceX也在认真盘算怎么把这些算力变成钱。 在最新公开的招股书里,AI基础设施被明确列为公司重要业务板块,与火箭发射并列。 马斯克还透露,SpaceX正在与其他公司洽谈类似的算力租赁合作,轨道数据中心也在规划中。 从制造火箭到出租算力,这条新赛道的核心资产,就是Colossus系列集群。 Colossus II未来也可能对外租用,但马斯克态度耐人寻味。 他表示“并不承诺”长期租赁,可以随时收回,一切都要看自己的算力需求。 言下之意很清楚,外部客户,永远排在自家业务后面。 A社算力协议只签了半年 这个“随时收回”,不只是说说而已。 前段时间,xAI将Colossus以每年450亿美元的价格租给Anthropic,据传合约长达三年。 听起来是一笔稳稳的大生意,但马斯克很快在推文里泼了冷水。 马斯克澄清,SpaceX从未承诺将Colossus长期出租,现有的只是一份180天租约,到期后双方均可提前90天通知取消。 他还特别点明,选择短期条款是SpaceX主动要求的,不是A社的意思。 更准确地说,根据SpaceX的招股书显示,协议的实际条款是这样的: Anthropic每月支付12.5亿美元,合同约定到期时间为2029年5月,潜在总金额超过400亿美元。