safe-rlhf 产品

来源: githubOPEN_SOURCE开源PythonApache-2.0发布于 2023-05-15

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

1602

Stars

132

Forks

4

技术栈

0

替代方案

0

相关事件

大语言模型大模型 / LLM

1

开发者/公司

4

相关技术

0

替代方案

0

相关事件

0

相关文章

开发者/公司查看全部 (1)

P

PKU-AlignmentCOMPANY

相关技术查看全部 (4)

transformers(2011)

LLaMAarchitecture

GPTarchitecture

Pythonlanguage

替代方案

暂无数据

相关事件

暂无数据

相关文章

暂无数据