谷歌全家桶,都被新模型“污染”了 文章

36kr 资讯2026-05-27NEWSzh作者: 字母AI

摘要

距离谷歌的Gemini 3.5 Flash发布已经一周多了。 皮查伊在谷歌发布会上口口声声地表示,Gemini 3.5 Flash性能比3.1 Pro还强,说它是Agent时代的底座。 可结果呢?网上对Gemini 3.5 Flash的评价,除了速度快这唯一的优点外,全是缺点。输出的内容错误多、啰嗦、干活token消耗量爆炸…… 谷歌Antigravity负责人瓦伦·莫汉(Varun Mohan)在5月25日发帖称,谷歌已增设Gemini 3.5 Flash (Low) 模型用于优化资源消耗。 瓦伦表示,根据谷歌的内部测试数据,在处理简单任务时,Gemini 3.5 Flash (Low) 相比Gemini 3.5 Flash (Medium) 可以减少约45%的token生成量。在软件工程(SWE)任务上的表现,Gemini 3.5 Flash (Low) 普遍优于上一代旗舰模型Gemini 3 Flash (High)。 然而网友们并不买账,现在,瓦伦的评论区已经被网友们的冷嘲热讽彻底攻占。 热评第一条是“你们的产品测试过吗?看起来你们是拿我们在做测试啊!” 第二条是“能否也解决一下图像模型的生成数量限制问题?你们的能力需要对标Codex。我使用Codex可以生成1000张图像,但在谷歌的高级套餐下,我只能使用Antigravity生成24张。” Gemini 3.0 Pro出来的时候,所有人都在为谷歌鼓掌,OpenAI甚至因此拉响红色警报,以防止被谷歌超越。 然而到了 3.5 Flash,谷歌成了小丑,眼瞅着就要步入Meta的后尘。 那我们不禁要问,谷歌,你这是咋了? Gemini 3.5的表现没有达到预期 网上对Gemini 3.5 Flash的评价非常一致,很快,但是不够好。 皮查伊在发布会上反复强调模型多便宜,然而现实中情况截然相反。 按照官方定价,Gemini 3.5 Flash每百万输入token收费1.5美元,每百万输出token收费9美元,确实比Claude Opus 4.7的5美元和25美元便宜。 但这只是价格表,真正决定成本的,是完成一个任务到底要消耗多少token。 Artificial Analysis在完整评估套件中测试发现,Gemini 3.