Deepseek 能否为中国节省 1 万亿美元? 文章

36kr 资讯2026-06-03NEWSzh作者: 胡说成理

摘要

导语 2026 年下半年,英伟达将交付它迄今最强大的 AI 平台:Vera Rubin VR200 NVL72。一个整机柜里塞进 72 颗 Rubin GPU 和 36 颗 Vera CPU。摩根士丹利估算,这台机器的物料成本约为 780 万美元。 这个数字已经够吓人了。但更值得盯住的,是它的钱花在了哪里。 在这 780 万里,有大约 200 万美元,既没花在那颗举世闻名的 GPU 芯片上,也没花在运算核心上,而是花在了内存上——高带宽显存(HBM4)与普通内存(LPDDR5X)。仅仅一年之间,这部分内存的成本就因为涨价飙升了 435%。 这是一个信号。在 AI 这台越来越贵的机器里,钱正在从“负责计算的零件”,大量流向“负责记忆和存储的零件”。 请记住这个信号。因为这篇文章要讲的 DeepSeek,做的恰恰是一件相反的事:所有人都被时代推着,为越来越贵的内存支付 AI 硬件溢价。而它在想办法,在不削弱竞争力的前提下,通过软硬件融合,让这些昂贵的硬件提升 4 倍以上的 token 产能,也就是等效于节省了 75% 的硬件投资。 而这件事的尽头,近来有一个猜想在被热议——DeepSeek 能否通过自己的努力,为中国的 AI 基础设施建设节省一万亿美元? 这真的可能吗? 一万亿美元,是省出来的 刚才那张英伟达的报价单,是最近 AI 基建账本里最硬的一笔钱。在当前供需格局下,你要买最先进的 AI 机器,就必须接受这张账单。 DeepSeek 改变不了这件事。 它改变的是另一件事:同样一台机器,同样那 200 万美元的昂贵存储硬件,究竟能吐出多少 Token。 这个问题,在 DeepSeek V4 发布之后,变得尤其具体。 V4 更值得关注的,不只是模型本身,而是它展示出的三板斧:第一,继续压缩“记性”,让长上下文不再拖垮显存;第二,按需唤醒“身体”,让巨大的专家模型不必每次全员上阵;第三,把重复计算变成可复用资产,让算过的上下文不再一遍遍烧钱。 这些技术的特性部分呈现一个突出的特点——它们在软硬件协同上下了功夫,而非纯软件的优化。所以才有人用那个玩笑式的比喻——DeepSeek也许会成为中国最大的AI硬件公司。