trlx 产品

来源: githubOPEN_SOURCE开源PythonMIT发布于 2022-10-03

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

4747

Stars

485

Forks

2

技术栈

0

替代方案

0

相关事件

trlx · 开发者/公司

C
CarperAICOMPANY