摘要
“Tokenmaxxing”(把Token消耗拉到极限)正在成为开发者社区的新热词。Token预算,被视为衡量AI使用深度的新指标。有初创公司CEO甚至把Anthropic账单晒在LinkedIn上,当作公司AI化程度的重要证明。 图源:Swan AI CEO Amos Bar-Joseph 然而,一个关键问题被忽略了:我们到底在用Token创造什么? 成本确实在飙升。高盛预测,未来几年Token使用量可能增长24倍以上;英伟达应用深度学习副总裁甚至坦言,AI成本已超过团队薪资。 图源:高盛 但产出的质量呢?数据给出了不太乐观的答案。 代码生成领域尤为典型。Waydev跟踪50多家企业发现,AI生成代码的长期保留率仅为10%~30%。GitClear的报告更直接:重度AI使用者的代码返工量是非AI用户的9.4倍。另一平台Jellyfish的统计则显示,部分团队代码吞吐量提升2倍,代价却是Token成本飙升近10倍。 代码翻修量增速超过生产力增速,数据来源:GitClear 当Token消耗持续增长,投入产出比变得尤为主要。Token焦虑,正在成为AI落地的真实阻力。 在这场日益蔓延的“Token焦虑”中,Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布,自6月1日起,旗下全模态模型API无限期免费开放。 01.当Token越来越贵,一家AI Lab把账单直接清零 Agnes AI本次开放覆盖其三款核心模型:文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。 自6月1日起,上述模型API将面向全球开发者无限期免费开放。对于中小团队、独立开发者和创作者而言,模型调用的成本门槛彻底“消失”,试错空间被极大释放。 在Agnes AI看来,高质量AI不应只属于高预算公司。Agnes AI希望通过免费开放文本、图片、视频全模态模型API,让有限的预算更多用于产品创新和功能迭代。 02.文本、图片、视频一起开放,一手实测看看实力 成本归零之后,开发者更关心的是:模型到底能不能打?我们分别对文本、图像和视频模型进行了实测。 文本模型:1M超长上下文,快速搭建生产力场景…
摘要可能不完整,可查看原文