RLHF-Reward-Modeling 产品

来源: githubOPEN_SOURCE开源PythonApache-2.0发布于 2024-03-21

Recipes to train reward model for RLHF.

1531

Stars

109

Forks

2

技术栈

0

替代方案

0

相关事件

RLHF-Reward-Modeling · 替代方案

暂无数据