PAC-Bayesian Reinforcement Learning Trains Generalizable Policies 文章

ArXiv CS.AI2026-06-01NEWSen作者: Abdelkrim Zitouni, Mehdi Hennequin, Juba Agoun, Ryan Horache, Nadia Kabachi, Omar Rivasplata