Adan: Adaptive Nesterov Momentum Algorithm for Faster Optimizing Deep Models
816
Stars
70
Forks
6
技术栈
0
替代方案
相关事件