Better, Faster: Harnessing Self-Improvement in Large Reasoning Models 文章

ArXiv CS.CL2026-05-26NEWSen作者: Qihuang Zhong, Liang Ding, Juhua Liu, Bo Du, Leszek Rutkowski, Dacheng Tao