Reinforcement learning improves behaviour from evaluative feedback 论文

2015Nature引用 367

Reinforcement Learning in RoboticsData Stream Mining TechniquesAdvanced Bandit Algorithms Research

机器人 Reinforcement Learning in Robotics Data Stream Mining Techniques Advanced Bandit Algorithms Research

相关技术:Reinforcement Learning in Robotics Advanced Bandit Algorithms Research

Reinforcement learning improves behaviour from evaluative feedback · 作者

Michael L. Littman