摘要
美国当地时间5月19日,OpenAI联合创始人、前特斯拉AI负责人安德烈·卡帕西(Andrej Karpathy)宣布加盟Anthropic。 “我加入了Anthropic。”卡帕西在X平台上写道,“我认为未来几年将是大语言模型前沿发展最具决定性意义的阶段。我非常期待加入这个团队,重回研发一线。” 根据外媒报道,卡帕西将在预训练团队负责人尼克·约瑟夫(Nick Joseph)的统筹下,组建一支新团队,核心使命是利用Claude来加速预训练研究。 换言之,他的工作是让AI来优化AI的训练过程本身。 这个方向在AI安全领域有一个流传已久的正式名称:递归自我改进(Recursive Self-Improvement,RSI)。其核心逻辑是,AI系统通过不断优化自身的训练过程,实现能力的迭代跃升。 数十年来,RSI更多地存在于学术论文和思想实验之中。不过,Anthropic 联合创始人 Jack Clark 5 月 4 日发长文预测,到 2028 年底 AI 实现递归自我改进的概率约为 60%。5月13日,Meta FAIR 前研究总监田渊栋的新公司Recursive Superintelligence(简称 Recursive SI)正式官宣,核心方向也是递归自我改进。 随着算力、数据和模型能力同步跨越临界点,RSI正在被顶尖AI实验室付诸实践,成为真实的工程项目。 01 为什么是卡帕西? Karpathy的职业轨迹本身解释了他为什么是这个岗位的合适人选。 他是OpenAI最早的研究科学家之一,2015年至2017年专注于深度学习与计算机视觉。2017年被埃隆·马斯克挖到特斯拉出任AI总监,主导Autopilot视觉团队,将神经网络从论文推到了数百万辆量产车上。 在特斯拉的五年中,他主导构建了被称作“数据引擎”的闭环系统本质上是一套工程化的“模型自我改进”流水线,只不过改进对象是感知模型而非语言模型。他在2022年从Tesla离职,于2023年短暂回到OpenAI,在那里待了约一年后再次离开,2024年创办AI教育公司Eureka Labs。 预训练是大模型流水线中最昂贵、最依赖算力,也最依赖工程经验的环节。TechCrunch评价Karpathy是“少数能同时跨越LLM理论和大规模训练实践的研究者之一”。
相关事件
暂无数据
相关产品
暂无数据