a fast and user-friendly runtime for transformer inference (Bert, Albert, GPT2, Decoders, etc) on CPU and GPU.
1548
Stars
207
Forks
5
技 术栈
0
替代方案
相关事件