摘要
最近,越来越多公司发现:还没等到 AI 真正改造业务,Token 账单先把自己给改造了。原来 AI 转型里最贵的坑,就是把 Token 的使用量当成了员工的 KPI。 某公司的老板大手一挥,给全员开通 Claude 授权,却忘了设上限。一个月烧掉 5 亿美元,折合人民币 30 多亿。等财务反应过来,上亿美元的账单已经在路上。 5 亿美元究竟是怎么烧的?扒开细节,发现其中有相当一大块,都是某些员工跑任务时,反复撞上报错,一遍遍手动点"重试"点出来的。 如果只是一家公司手滑,那叫倒霉。问题是,类似的“事故”一抓一大把。 Meta 内部有人做了一个叫 Claudeonomics (Claude 经济学)的榜单,统计谁用 AI 用得最猛。30 天里,全公司烧掉超过 60 万亿个 Token,光“榜一大哥”一人就占了 2810 亿 Token,将近 50 万美金 / 月。 Uber 最早给 5000 名工程师配齐 Claude Code,使用率几个月内猛冲,结果一季度刚过,CTO 就叫苦不迭:2026 全年的 AI 编程预算已提前烧光。 国内也不遑多让。在阿里云峰会上,米哈游技术负责人就提到,有员工为了做一个项目,搭了几十个 Agent 协作,一晚上烧掉 200 万人民币的 Token。 Token账单为何会如此失控? 高盛今年 5 月的报告《Decoding the Agentic Economy》点破了真相:在 Agentic 模式下,模型由于需要不断进行“思考 - 检索 - 调用工具 - 重新读取完整上下文”的循环,其 Token 消耗量达到了普通问答模式的 1000 倍。 你以为它在思考,其实它也在烧钱。而模型公司、云厂商、芯片公司,更是 心照不宣地把“多用 AI、多烧 Token”包装成了先进生产力的进步。 这时再看 Anthropic 单季度超百亿、估值破万亿美元的造富狂飙,老黄赢麻了的增长曲线,是不是就不难理解了?下游“事故性”烧掉的钱,转身就成了模型公司财报上实打实的进账。同一笔钱,两个视角:一个叫增长,一个叫事故。 亚马逊先动手了 烧掉几亿美元或许是个极端案例,但为了烧钱而烧钱的现象,早就成了科技大厂的通病。 直到亚马逊实在看不下去,第一个动了刀。