Finite-Time Bounds for Fitted Value Iteration 论文

2008引用 263

Markov Chains and Monte Carlo MethodsMachine Learning and AlgorithmsReinforcement Learning in Robotics

机器人 Machine Learning and Algorithms Reinforcement Learning in Robotics Markov Chains and Monte Carlo Methods

相关技术:Markov Chains and Monte Carlo Methods Machine Learning and Algorithms Reinforcement Learning in Robotics

Finite-Time Bounds for Fitted Value Iteration · 相关技术

相关技术

Markov Chains and Monte Carlo Methods Machine Learning and Algorithms Reinforcement Learning in Robotics