Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors 论文

2021IEEE Transactions on Neural Networks and Learning Systems引用 280

Reinforcement Learning in RoboticsAdversarial Robustness in Machine LearningAdaptive Dynamic Programming Control

Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors · 相关技术