🚀 An open-source, hands-on curriculum bridging the gap from basic RL concepts to LLM alignment, RLVR, and advanced Agentic systems.
1686
Stars
86
Forks
2
技术栈
0
替代方案
相关事件
1
开发者/公司
相关技术
相关文章
暂无数据