safe-rlhf 产品

来源: githubOPEN_SOURCE开源PythonApache-2.0发布于 2023-05-15

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback