Anthropic发布Opus 4.8,关键一项还是输了GPT-5.5 文章

36kr 资讯2026-05-29NEWSzh作者: 36氪的朋友们

摘要

美国当地时间5月28日, Anthropic发布了其旗舰模型的最新升级版Claude Opus 4.8。这次更新距离Opus 4.7发布只隔了41天,比这家公司正常的升级节奏快了不少。但是,Opus 4.8 更像是一次基于Opus 4.7 的“能力与推理行为升级”。 常规使用的定价与Opus 4.7相比没有变化:标准模式下每百万输入token 5美元,输出25美元。 但在功能层面,有三个变化值得关注:模型在处理不确定信息时变得更加坦诚,不再轻易做出没有根据的断言;快速模式的使用成本直接砍到了原来的三分之一;以及Claude Code里新增了一项叫“动态工作流”的能力,允许模型同时调度数百个子智能体去处理规模庞大的任务。 Opus 4.8今天已经在所有平台上可用,包括claude.ai、Claude Code、API和Cowork。开发人员可以通过claude-opus-4.8来调用它。 同时,伴随新模型一起发布的还有几项周边更新:用户现在可以手动调节Claude为每个回答付出的“努力”程度,而开发者在API里也能在消息数组中直接插入系统指令,方便在任务中途更新权限、token预算或环境上下文。 同日,Anthropic宣布完成了650亿美元的H轮融资,投后估值达到9650亿美元。 一个“小修小补”的更新,和一轮估值不止翻倍的融资,还有继续“预告”神秘模型Mythos。 01 一个更“诚实”的协作者,不再硬着头皮瞎编 很多人都受过AI的“欺骗”,它明明一知半解,却表现得胸有成竹,最后交出一份漏洞百出的答案,直到用户自己发现问题。 Opus 4.8的这次升级,一个核心方向就是更多消解这种“不懂装懂”的倾向。 Anthropic官方公布了一项很直观的评估结果:Opus 4.8让代码里藏着漏洞却不被发现的可能性,比它的前辈Opus 4.7低了大约四倍。这得益于它在面对不确定性情况时,会选择主动告知用户,而非掩盖问题。 一些提前参与测试的用户,也给出了类似的反馈。对冲基金桥水公司提到,升级后最明显的不同在于“Opus 4.8主动标记输入和输出分析问题的倾向,这是其他模型经常遗漏并留给用户去发现的”。另一个来自AI编程工具Devin制造商Cognition的反馈则说,Opus 4.

相关事件

暂无数据

相关人物

暂无数据