UCB revisited: Improved regret bounds for the stochastic multi-armed bandit problem 论文

2010Periodica Mathematica Hungarica引用 291

Advanced Bandit Algorithms ResearchReinforcement Learning in RoboticsOptimization and Search Problems

机器人 Reinforcement Learning in Robotics Advanced Bandit Algorithms Research Optimization and Search Problems

相关技术:Reinforcement Learning in Robotics Optimization and Search Problems Advanced Bandit Algorithms Research

UCB revisited: Improved regret bounds for the stochastic multi-armed bandit problem · 相关文章

暂无数据