硅谷深陷算力荒:H200一夜涨价30%,H100抢到缺货,Karpathy也未能幸免 文章

36kr 资讯2026-05-20NEWSzh作者: AI前线

摘要

2026 年 5 月的硅谷,对于 AI 算力的“饥荒”和焦虑,正达到一个前所未有的高度。 哪怕那些站在算力中心的人,也不得不开始为算力排队。 在英伟达,负责应用深度学习研究团队的 Bryan Catanzaro 找黄仁勋申请训练卡。最近大家一直抱怨卡不够用,受限太多。 “不好意思,那些卡已经卖掉了”,这是老黄给出的回复。 Catanzaro 是英伟达的大功臣。十多年前,正是他留意到,GPU 迎来了首批 AI 买家——研究员,且几乎疯狂扫货。基于这个洞察,老黄才下定决心把整间公司押注 AI 赛道。 当年帮英伟达赌对算力卡的人,现在却买不到自家的 GPU 了。 而比“卖铲子的没铲子了”更戏剧性的事,还发生在谷歌。 去年夏天,DeepMind 的研究员 Andrew Dai 判断,视觉推理是个值得做的方向。于是向公司内部提了一批 TPU 的资源需求。 但申请迟迟未批。拒绝的理由,倒不是研究方向不够好,而是项目不能为下一代的 Gemini 服务。当时的内部原则是,资源应该优先流向付费客户和旗舰模型。 “在谷歌内部,每一块 TPU 的背后,都有三位竞争者”,华盛顿大学计算机系的荣誉教授 Oren Etzioni 聊到。现实很残酷,如果你的项目不能直接带来收入,你就是在和付费客户抢资源。 Dai 最终选择离职创业。和他做出同样选择的,还有 Anna Goldie。 有趣的是,谷歌用来挽留 Goldie 的筹码不是加薪,也不是期权,而是——更多的 TPU 算力卡。 但 Goldie 还是走了,还拿到了 3.35 亿美元的融资,“这笔钱能买到的算力,和当初 DeepMind 挽留我开出的条件,几乎相当。” 当大厂围墙内的算力变成一种“组织权限”,出走就成了唯一解。 而在围墙之外,独立开发者和研究员面对的,是比“GPU 短缺”更难的处境:连卡都租不到。 这事已经迫切到什么程度了呢? 这两天,AI 大神 Andrej Karpathy 都忍不住发帖吐槽。他表示,在录制 nanochat 教学视频时,才突然意识到,如果实验的第一步是,让学员“从云平台启动一台 8×H100 的服务器”,那么绝大部分人将倒在起跑线上。 有大神出来喊话,评论区迅速变成大型比惨现场。 H100 抢不到,H200 一夜涨价 30%

摘要可能不完整,可查看原文