摘要
今年Google I/O的主题演讲又是信息密度巨大的一次,大到让外界抓不住重点。 Google一直是中国AI公司对标学习的重要目标,但随着本届I/O旗舰顶级模型缺席,Agent产品事实上的迟到和“补课”,一系列因素影响下不少AI从业者感到失望,好奇Google到底在干嘛。 在过去两天,我有机会和包括DeepMind CTO Koray Kavukcuoglu,Google首席AI科学家Jeff Dean,以及Google CEO Sundar Pichai等Google的关键人物交流,基于这些一手信息,来尝试理解今天Google的境况。 最终我发现这一切又落回到了Google对待DeepMind的方式上。 Google认为此刻最重要的事情是什么 很明显,Google内部上下此刻统一的最大共识,就是它自己是唯一真正AI全栈公司。在各种交流里,这给它带来的自信甚至超过我已经很高的预期,但这也不得不让人联想到ChatGPT出来后Google最初的狼狈——同样对Bard和一整个AI基础设施的积累充满信心,但因为过度自信而出了问题。 接下来上演的会是哪一版故事,在我看来最关键在于它对资源的分配决策上。当初先赌Bard,后来证明把钱和算力都给deepmind才是对的。 又到关键路口。既然全栈意味着巨大的竞争优势,今天Google内部基于此的资源分配决策是,不一股脑把最好资源给到最前沿模型,而是更加侧重the most usable models。 似曾相识。 所以这么看起来,Flash系列不是折中方案,它战略意义最重要,且可能占了更多可用算力资源。这和OpenAI和Anthropic 的策略非常非常不同。 在I/O keynote上一个没太多人留意的demo里,Gemini 3.5 flash在TPU 8i上做的任务,吞吐的速度居然幻视当年只追求快而不顾其他一切的Groq。与此同时对于新模型的一些体验反馈开始褒贬不一,这么看来,这其实是这种优先级策略和资源分配后必然的结果。 至于原因,其实就是Google一直在讲的。Pichai在小范围交流里说,他们看到的需求太大了,且不停增长,你想想过去互联网、手机等的故事,就知道该干什么:赶快去识别和满足重度用户之外最广泛需求,结合agent的火热,给它最可用最适合而不是“最强”的模型,就是Goo
摘要可能不完整,可查看原文