Don't decay the learning rate, increase the batch size 论文

2018arXiv (Cornell University)引用 271

Advanced Neural Network ApplicationsDomain Adaptation and Few-Shot LearningStochastic Gradient Optimization Techniques

人工智能 Advanced Neural Network Applications Domain Adaptation and Few-Shot Learning Stochastic Gradient Optimization Techniques

相关技术:Domain Adaptation and Few-Shot Learning Advanced Neural Network Applications Stochastic Gradient Optimization Techniques

Don't decay the learning rate, increase the batch size · 相关文章

暂无数据