From Trainee to Trainer: LLM-Designed Training Environment for RL with Multi-Agent Reasoning 文章

ArXiv CS.CL2026-06-17NEWSen作者: Chao Chen, Chengzu Li, Zhiwei Li, Yinhong Liu, Zhijiang Guo

查看原文 →

From Trainee to Trainer: LLM-Designed Training Environment for RL with Multi-Agent Reasoning · 相关技术

相关技术

Large language model LLM-as-Environment-Engineer reinforcement learning