曝GPT-5.5用上“全球最快芯片”，Claude慌了文章

36kr 文章2026-05-18NEWSzh作者: 新智元

摘要

120B模型飙到2000 token/秒，CFO更放话已在跑GPT-5.5！Cerebras 560亿美元IPO首日暴涨68%，但SemiAnalysis万字拆解直指死穴。 SemiAnalysis，硅谷最硬核的芯片分析机构，4月份光是AI工具的订阅费就烧到了年化1000万美元。其中80%花在同一个地方，Anthropic的Opus 4.6 fast模式。它比标准模式贵6倍，但token输出速度快2.5倍！然后Opus 4.7来了。更聪明，跑分全面碾压上一代，但工程师集体拒绝升级。理由只有一个，4.7没有fast模式。他们宁可用更笨的模型，也要更快的token！而这个趋势的最大受益者，是一家刚刚以560亿美元估值登陆纳斯达克的芯片公司，Cerebras。 2000 token/秒，怎么来的 OpenAI今年2月甩出了GPT-5.3-Codex-Spark。名字挂着GPT-5.3的招牌，但底层是一个从完整版GPT-5.3 Codex蒸馏出来的小模型，参数量只有原版的十分之一，120B。虽然是用智能换来的，但速度确实夸张到离谱——2000 token/秒。作为对比，Anthropic最快的Opus 4.6 fast大约70-100 token/秒，GPT-5系列在英伟达GPU上是大约130 token/秒。而Codex-Spark一脚油门踩到了一个数量级开外。让它跑这么快的，正是Cerebras的WSE-3，一块餐盘大小的晶圆级芯片。这件事直接引爆了一笔246亿美元的合同，也把Cerebras一路推进了纳斯达克。5月14日首日暴涨68%，2026年至今最大科技IPO。但Cerebras CFO Bob Komin说，这还只是开胃菜。 IPO前夜，他在采访中亮了一张没人预料到的牌—— 我们服务所有模型，对模型大小没有限制。今天，我们正在跑万亿参数的模型。我们正在跑OpenAI内部的GPT-5.4和GPT-5.5。如果这是真的，Cerebras就不只是一个「小模型快跑」的玩家了，IPO当天的疯狂涨幅立刻站得住脚。但SemiAnalysis偏偏在同一周甩出了一篇两万字的技术拆解报告，直接把这个故事撕开了一道口子。 Cerebras公开云上，

摘要可能不完整，可查看原文

曝GPT-5.5用上“全球最快芯片”，Claude慌了文章

摘要

相关事件查看全部 (1)

相关公司查看全部 (6)

相关人物查看全部 (1)

相关产品查看全部 (4)

相关技术

曝GPT-5.5用上“全球最快芯片”，Claude慌了 文章

摘要

相关事件查看全部 (1)

相关公司查看全部 (6)

相关人物查看全部 (1)

相关产品查看全部 (4)

相关技术

曝GPT-5.5用上“全球最快芯片”，Claude慌了文章