UCB revisited: Improved regret bounds for the stochastic multi-armed bandit problem 论文

2010Periodica Mathematica Hungarica引用 291

Advanced Bandit Algorithms ResearchReinforcement Learning in RoboticsOptimization and Search Problems

机器人 Reinforcement Learning in Robotics Advanced Bandit Algorithms Research Optimization and Search Problems

相关技术:Reinforcement Learning in Robotics Optimization and Search Problems Advanced Bandit Algorithms Research

2

作者

3

相关技术

0

相关事件

0

相关文章

作者查看全部 (2)

Ronald Ortner

Peter Auer

相关技术查看全部 (3)

Reinforcement Learning in Robotics Optimization and Search Problems Advanced Bandit Algorithms Research

相关事件

暂无数据

相关文章

暂无数据