[ICLR2025 Spotlight🔥] Official Implementation of TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters
591
Stars
43
Forks
2
技术栈
0
替代方案
相关事件
暂无数据