GDSD: Reinforcement Learning as Guided Denoiser Self-Distillation for Diffusion Language Models 文章

ArXiv CS.AI2026-05-29NEWSen作者: Xiaohang Tang, Keyue Jiang, Che Liu, Qifang Zhao, Xiaoxiao Xu, Sangwoong Yoon, Ilija Bogunovic