20岁写出Transformer的人,真开源了2180亿大模型 事件
PERSONNEL2026-05-22影响: LOW
20岁写出Transformer的人,真开源了2180亿大模型 「Attention Is All You Need」,正是这篇著名的论文,催生了今天所有的大模型。 5月20日,该论文的一位共同作者Aidan Gomez,在X上宣布推出首个完全开源的Apache 2.0许可的模型:Cohere Command A+。 Gomez是前谷歌研究员,如今是Cohere的联合创始人兼CEO。 Command A+是Command A家族的最后一个模型,也是Cohere的第一个MoE(混合专家)模型。218B总参数,25B激活参数:一次性把视觉输入、推理、翻译和AI智能体能力,全部塞进了同一个模型。 最低部署配置:1张NVIDIA B200,或者2张H100。许可证:Apache 2.0。 https://cohere.com/blog/command-a-plus 据VentureBeat报道,这是Cohere历史上第一个真正可商用的开源旗舰。联合创始人Nick Frosst称它是「我们发过最好的模型」。 2180亿参数,每次干活的只有250亿 21