Variance Reduction Techniques for Gradient Estimates in Reinforcement Learning 论文

2004Journal of Machine Learning Research引用 323

Reinforcement Learning in RoboticsAdaptive Dynamic Programming ControlAdvanced Bandit Algorithms Research

Variance Reduction Techniques for Gradient Estimates in Reinforcement Learning · 相关技术