🧠「大模型」2小时完全从0训练64M的小参数LLM!Train a 64M-parameter LLM from scratch in just 2h!
52286
Stars
6732
Forks
1
技术栈
0
替代方案
相关事件