A modular RL library to fine-tune language models to human preferences
2387
Stars
202
Forks
1
技术栈
0
替代方案
相关事件