HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱探索
趋势分析
登录
注册
IVR-R1: Refining Trajectories through Iterative Visual-Grounded Reasoning in Reinforcement Learning
文章
ArXiv CS.CV
2026-05-26
NEWS
en
作者: Chenghao Li, Fusheng Hao, Xikai Zhang, Likang Xiao, Yanwei Ren, Fuxiang Wu, Quan Chen, Liu Liu
大语言模型
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
IVR-R1: Refining Trajectories through Iterative Visual-Grounded Reasoning in Reinforcement Learning · 相关技术
相关技术
ORM
Multimodal Large Language Models (MLLMs)
ODE
LLM
language model
远程代码执行(RCE)
研究法辛烷值
多模态
reinforcement learning
alignment
Tera
SUL
Referring expression comprehension (REC)
NAT
MIT
large language models
IVR
HIS
For
FOL
Effort Metric Attention
ENA
EFI
Camouflaged object detection
ARG
ANN
iOS
TPU