从业者深度复盘:AI 定价模式崩解的必然性 文章

开源中国2026-05-25NEWSzh作者:

摘要

技术从业者 Arnon Shimoni 在个人博客发表长文,系统性地解释了当前 AI 定价模式崩解的根本原因,视角与媒体评论不同——这是一篇来自直接操刀定价决策者的复盘。 作者开门见山:微软取消内部 Claude Code 授权、Uber 在四个月内烧完 2026 年全年 AI 预算、GitHub 放弃固定费率方案——这些事件并非孤立的商业决策失误,而是整个行业在错误的假设上建立定价模型的必然结果。所谓"AI 补贴时代结束",本质是各公司当初把 AI 功能塞进每一个产品层级时,押注推理成本会持续下降——但这个押注从一开始就没有道理。 文章的核心逻辑从两个维度展开。第一是需求诱导定律(induced demand):每降低一次单位成本,用户行为就会随之膨胀。高速公路增加车道会吸引新的通勤需求,AI 降价会激发新的使用场景。上一代模型每 token 成本确实下降了最高 10 倍,但那是对标上一代的质量水平——用户不会因为成本降低而减少使用,恰恰相反:推理成本降低刺激了更长的上下文、更复杂的 Agent 工作流、更重的 reasoning 查询。作者举例自己的复杂推理查询从 2 分钟延长到 4 分钟以上,Agent  工作流从 1 次调用扩张到 50 次——单位成本下降,但调用量爆炸,总账单不减反增。 第二层是供给侧的成本结构彻底转向反面。Morgan Stanley 估算下一代 NVIDIA VR200 系列的物料清单将比上一代高出 95%,其中内存成本单独贡献了435%的增长。HBM(高带宽内存)市场被 SK 海力士主导,三星的良品率落后,美光更在其后——而内存工厂的产能扩张周期至少18到36个月,且已在低估需求的规划假设下排产。GPU 价格是稀缺定价的典型表现:顶级 GPU 和 TPU 的集群规模成本比上一代贵约2倍,HBM 价格在 18 个月内涨了 4 倍。每个超大规模云厂商现在都在宣传"建设千兆瓦园区"和"核能 PPA"的计划,无论是真是假。 作者援引了 Ed Zitron 对 Anthropic CFO 宣誓供词的分析:该公司 2026 年已在计算基础设施上支出 100 亿美元,但仅产生 50 亿美元营收——实验室在计算和推理上完全处于水下,只能涨价以维持灯火。