RLHF-Reward-Modeling 产品

来源: githubOPEN_SOURCE开源PythonApache-2.0发布于 2024-03-21

Recipes to train reward model for RLHF.

1531

Stars

109

Forks

2

技术栈

0

替代方案

0

相关事件

开发者/公司查看全部 (1)

R
RLHFlowCOMPANY

相关技术查看全部 (2)

LLaMAarchitecture
Pythonlanguage

替代方案

暂无数据

相关事件

暂无数据

相关文章

暂无数据