Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses 文章

ArXiv CS.CL2026-06-02NEWSen作者: Pengcheng Jiang, Zhiyi Shi, Kelly Hong, Xueqiang Xu, Jiashuo Sun, Jimeng Sun, Hammad Bashir, Jiawei Han