Stochastic policy gradient reinforcement learning on a simple 3D biped 论文

2005引用 270

Robotic Locomotion and ControlReinforcement Learning in RoboticsProsthetics and Rehabilitation Robotics

Stochastic policy gradient reinforcement learning on a simple 3D biped · 相关技术