Adan: Adaptive Nesterov Momentum Algorithm for Faster Optimizing Deep Models
816
Stars
70
Forks
8
技术栈
0
替代方案
相关事件
暂无数据