OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents 文章

ArXiv CS.CV2026-06-05NEWSen作者: Rui Yang, Qianhui Wu, Yuxi Chen, Hao Bai, Wenlin Yao, Hao Cheng, Baolin Peng, Huan Zhang, Tong Zhang, Jianfeng Gao