Deepseek 能否为中国节省 1 万亿美元？文章

36kr 资讯2026-06-03NEWSzh作者: 胡说成理

摘要

导语 2026 年下半年，英伟达将交付它迄今最强大的 AI 平台：Vera Rubin VR200 NVL72。一个整机柜里塞进 72 颗 Rubin GPU 和 36 颗 Vera CPU。摩根士丹利估算，这台机器的物料成本约为 780 万美元。这个数字已经够吓人了。但更值得盯住的，是它的钱花在了哪里。在这 780 万里，有大约 200 万美元，既没花在那颗举世闻名的 GPU 芯片上，也没花在运算核心上，而是花在了内存上——高带宽显存（HBM4）与普通内存（LPDDR5X）。仅仅一年之间，这部分内存的成本就因为涨价飙升了 435%。这是一个信号。在 AI 这台越来越贵的机器里，钱正在从“负责计算的零件”，大量流向“负责记忆和存储的零件”。请记住这个信号。因为这篇文章要讲的 DeepSeek，做的恰恰是一件相反的事：所有人都被时代推着，为越来越贵的内存支付 AI 硬件溢价。而它在想办法，在不削弱竞争力的前提下，通过软硬件融合，让这些昂贵的硬件提升 4 倍以上的 token 产能，也就是等效于节省了 75% 的硬件投资。而这件事的尽头，近来有一个猜想在被热议——DeepSeek 能否通过自己的努力，为中国的 AI 基础设施建设节省一万亿美元？这真的可能吗？一万亿美元，是省出来的刚才那张英伟达的报价单，是最近 AI 基建账本里最硬的一笔钱。在当前供需格局下，你要买最先进的 AI 机器，就必须接受这张账单。 DeepSeek 改变不了这件事。它改变的是另一件事：同样一台机器，同样那 200 万美元的昂贵存储硬件，究竟能吐出多少 Token。这个问题，在 DeepSeek V4 发布之后，变得尤其具体。 V4 更值得关注的，不只是模型本身，而是它展示出的三板斧：第一，继续压缩“记性”，让长上下文不再拖垮显存；第二，按需唤醒“身体”，让巨大的专家模型不必每次全员上阵；第三，把重复计算变成可复用资产，让算过的上下文不再一遍遍烧钱。这些技术的特性部分呈现一个突出的特点——它们在软硬件协同上下了功夫，而非纯软件的优化。所以才有人用那个玩笑式的比喻——DeepSeek也许会成为中国最大的AI硬件公司。

Deepseek 能否为中国节省 1 万亿美元？文章

摘要

相关事件

相关公司查看全部 (3)

相关人物

相关产品查看全部 (4)

相关技术查看全部 (2)

Deepseek 能否为中国节省 1 万亿美元？ 文章

摘要

相关事件

相关公司查看全部 (3)

相关人物

相关产品查看全部 (4)

相关技术查看全部 (2)

Deepseek 能否为中国节省 1 万亿美元？文章