HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱探索
趋势分析
登录
注册
Efficient Agentic Reinforcement Learning with On-Policy Intrinsic Knowledge Boundary Enhancement
文章
ArXiv CS.CL
2026-05-27
NEWS
en
作者: Dingwei Chen, Zefang Zong, Zhipeng Ma, Leo Luo, Yang Li, Chengming Li, Peng Chen, Jie Jiang
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
Efficient Agentic Reinforcement Learning with On-Policy Intrinsic Knowledge Boundary Enhancement · 相关技术
相关技术
ODE
远程代码执行(RCE)
reward hacking
reinforcement learning
Tools
Synthetic Aperture Radar
Stan
Parts-of-Speech (POS) tags
PROBE
PPR
OWL
NAT
LMM
LLM-based agent
IMU
HIS
For
FFI
EFI
Agentic RL
ARG
ANN
Agent
API
ICE