摘要
2026年除了 harness 之外,Agent 领域最热的概念之一,就是 multi-agent,甚至是 Agent swarm。 Codex、Claude Code、Cursor、Devin、Kimi、Manus,几乎所有 AI 公司都在朝这个方向走。因为现在随着任务复杂化,一个 Agent 的能力不足以覆盖,那就上一群 Agent。一个 Agent 的速度太慢,那就多 Agent 并行。 人类就是这么工作的。公司不是一个超级员工,而是一套组织。项目经理拆任务,工程师写代码,测试团队查 Bug,法务和安全团队兜底。 既然人类能靠组织分工处理复杂问题,为什么 AI 不行? 过去一年,产业界确实把这件事往前推了很大一步。靠着 harness 的进步和模型能力的升级,任务能拆、并发能隔离、权限能控制、错误能审查、日志能追踪。 这让大家敢把 Agent 成批放出去干活。 然而更深处的问题没有消失。 在过去一年一系列研究中,我们发现 Agent 聚在一起以后,不只是会撞车、抢锁和覆盖代码。它们还会像人类组织一样,从众、迎合、甩锅、过早共识、错误社会化,甚至出现公开表达和私人判断之间的断裂。 到了今年,我们甚至发现这不是一张平铺的问题清单,这是一条向内下沉的裂缝。 这篇文章要做的事,就是把多智能体结构现在面对的几层问题理清楚。看看这条智能体合作之下的裂缝,到底裂到了哪里。 01 第一层,harness 在处理的外部组织病 multi-agent 最先遇到的问题,是 Agent 间如何协作,才能保证任务能够完成。 你不能让几十个 Agent 在同一个仓库里自由发挥,它们之间得有个有效的组织形态,能让这些各自为战的 Agent 拧成一股绳。 所谓 harness,做的就是把一群不稳定的执行单元,关进一个外部组织结构里。 Planner 像项目经理,负责拆任务;worker 像执行员工,负责干具体活;session log 像会议记录,记下过程;shared filesystem 像共享文件柜,放中间结果;review queue 像最后的审稿台,把最终输出先拦住,等人类检查。 简单来讲,harness 给机器搭了一套公司制度。 但架构有了,信息流通就成了核心问题。