trlx 产品

来源: githubOPEN_SOURCE开源PythonMIT发布于 2022-10-03

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)