IVR-R1: Refining Trajectories through Iterative Visual-Grounded Reasoning in Reinforcement Learning 文章

ArXiv CS.CV2026-05-26NEWSen作者: Chenghao Li, Fusheng Hao, Xikai Zhang, Likang Xiao, Yanwei Ren, Fuxiang Wu, Quan Chen, Liu Liu