Thompson Sampling: An Asymptotically Optimal Finite-Time Analysis 论文

2012Lecture notes in computer science引用 364

Advanced Bandit Algorithms ResearchReinforcement Learning in RoboticsSmart Grid Energy Management

机器人 Reinforcement Learning in Robotics Advanced Bandit Algorithms Research Smart Grid Energy Management

相关技术:Advanced Bandit Algorithms Research Reinforcement Learning in Robotics

3

作者

2

相关技术

0

相关事件

0

相关文章

作者查看全部 (3)

Rémi Munos

Nathaniel Korda

Emilie Kaufmann

相关技术查看全部 (2)

Advanced Bandit Algorithms Research Reinforcement Learning in Robotics

相关事件

暂无数据

相关文章

暂无数据