摘要
DeepSeek和GPT合体写论文了! 智东西5月27日报道,昨晚,DeepSeek资深研究员陈德里(Deli Chen)放出一篇他和Agent合写的45页论文,其中99%内容都是CodeAgent所写。 论文题目是《从Copilots到同事:自主科研智能体综述(From Copilots to Colleagues:A Survey of Autonomous Research Agents)》,作者是陈德里、DeepSeek-V4-Pro、GPT-Image2。 陈德里还特意发了免责声明:这篇论文绝非严谨学术论文、不代表任何公司或组织观点,只是出于兴趣以及顺便测试下他搭建的DeliAutoResearch。 他透露,论文共迭代6次,耗时6天搞定,而初稿仅用了76分钟。期间智能体累计运行约108轮、消耗Token约64.8万、LaTeX代码共2234行,最终成品45页,其中包含7个图标、4个表格,文件大小538KB。陈德里也不禁感叹,同样的工作以前至少需要一个月才能完成,而这次他本人的“CPU运转时长”不到2小时。 陈德里是DeepSeek-V1、V2、V3、V4、DeepSeek-R1、DeepSeek-Coder、DeepSeek-MoE架构的核心贡献者,他曾获得北京大学信息管理学士学位及计算机科学硕士学位,曾在腾讯担任微信AI研究员。 这篇论文梳理了机器学习、软件工程、科学发现三大领域共计105篇相关文献,陈德里称已经对这些文献进行了验证。其核心目的是为能够自主开展研究的AI智能体提供统一的分析框架,主要有四项研究成果: 1、提出一套五级自主能力分级体系(L1–L5),层级从代码自动补全延伸至完全自主制定研究规划,为各类系统的界定与对比提供规范的术语标准。 2、剖析了四大主流架构模式:单智能体循环、多智能体协作、分层调度编排、工具增强执行;同时搭建对比分析框架,评估各类架构在可扩展性、成本、稳定性及人工监管方面的优劣取舍。 3、基于六维特征矩阵,对17款主流系统展开分析。研究结果表明,当前前沿系统普遍处于L4级别(限定领域内可完成多步骤自主执行),而L5级别仍停留在目标构想阶段。