Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads
2735
Stars
202
Forks
0
技 术栈
替代方案
相关事件
暂无数据