谷歌AI的14年、Gemini翻身之战,与视觉理解模型:专访DeepMind前核心科学家Andrew Dai 文章

36kr 资讯2026-05-20NEWSzh作者: 硅谷101

摘要

他的论文,启发了OpenAI GPT的诞生。 在谷歌研究AI 14年,Andrew Dai推动数项重要论文、辗转数个产品,最后成为带领Gemini打下翻身之战的核心人物之一。 Andrew长期处在谷歌AI研发的中枢:从早期sequence learning(序列学习)、文本生成、对抗训练,到 PaLM、FLAN、Gemini、多模态和长上下文等等。与他合作论文的,都是谷歌的众多传奇大佬人物,包括Quoc Le、Ian Goodfellow、Liam Fedus、Jeff Dean等人。Andrew的职业轨迹可以说就是一部谷歌AI大模型的编年史。 然而在将Gemini 3顺利上线之后,Andrew Dai决定离开待了近14年的谷歌。原因是他看到了一条大公司“不敢走”、或者是“走得太慢”的路——不是纯语言模型,也不是世界模型,而是语言与视觉推理的结合。 今年4月,Andrew创立的Elorian AI宣布融资5500万美元,估值3亿美元,正式从保密阶段走向公众视野。投资方包括Menlo Ventures,Altimeter Capital等主流硅谷基金,还包括英伟达和以个人身份参与的Jeff Dean。 2026年的Google I/O正在召开,我们此次与Andrew一起回顾了谷歌过去14年的AI发展史:如何错过,如何落后,如何追赶,又如何重回巅峰的。这背后究竟有一些什么样的故事?Andrew Dai现在要做的多模态视觉推理模型又是什么? 硅谷没有秘密,但有一群信仰不一样未来的科学家们。在巨头们押注SOTA LLM之际,众多科技领军人物都开始纷纷创建自己的AI前沿新实验室(Neolabs),他们不拼算力和参数,而是希望找到一条真正达到智能的路径。此次,硅谷101也开启了Neolabs特辑,想和这群科学家们深度聊聊,他们眼中的AGI之路。今天这期,是此次特辑的第一期视频播客。 01 从伦敦到硅谷,一位谷歌AI核心科学家的14年 陈茜:非常感谢Andrew,欢迎你来做客硅谷101。我觉得你们的新办公室这边采光很好,这个房间你们以后准备用来做什么? Andrew Dai:这个房间以后会让研究员和工程师坐在这里。我们租办公室至少要租两年,所以已经预估好两年后会有多少人了。 陈茜:两年后你会有多少人? Andrew Dai:可能是

摘要可能不完整,可查看原文