HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱 探索
趋势分析
登录
注册
F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare
文章
ArXiv CS.AI
2026-05-26
NEWS
en
作者: Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, Viacheslav Sinii, Alexey Malakhov, Daria Korotyshova, Daniil Gavrilov
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare · 相关技术
相关技术
PLA
远程代码执行(RCE)
reinforcement learning
Referring expression comprehension (REC)
Reinforcement learning with verifiable rewards
RLVR
Prompt
Parts-of-Speech (POS) tags
OWS
OTA
MIT
Human-Robot Interaction
HIS
Group
GRPO
For
Focal Loss
FFI
ARG
ANN
ICE