REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge 文章

ArXiv CS.AI2026-06-01NEWSen作者: Yasi Zhang, Tianyu Chen, Mingyuan Zhou, Oscar Leong, Ying Nian Wu, Michal Lukasik