Markovian Decision Processes with Uncertain Transition Probabilities 论文

1973Operations Research引用 227

Reinforcement Learning in RoboticsAdvanced Bandit Algorithms ResearchOptimization and Search Problems

机器人 Reinforcement Learning in Robotics Advanced Bandit Algorithms Research Optimization and Search Problems

相关技术:Advanced Bandit Algorithms Research Reinforcement Learning in Robotics Optimization and Search Problems

Markovian Decision Processes with Uncertain Transition Probabilities · 作者

Roy E. Lave

Jay Satia