CPPO: Contrastive Perception Policy Optimization for VLM Agents 事件

Name: CPPO: Contrastive Perception Policy Optimization for VLM Agents
Start: 2026-05-28

PRODUCT_LAUNCH2026-05-28影响: MEDIUM

CPPO: Contrastive Perception Policy Optimization for VLM Agents arXiv:2601.00501v2 Announce Type: replace Abstract: We introduce CPPO, a Contrastive Perception Policy Optimization method for finetuning vision--language models (VLMs). Reliable perception is a core requirement for VLM-based agents that must reason and act in open-ended environments: faulty visual grounding cascades directly into faulty actions, hallucinated tool calls, and unsafe decisions. While reinforcement learning (RL) has s

人工智能

关系图谱

CPPO: Contrastive Perception Policy Optimization for VLM Agents 事件

相关公司查看全部 (10)

相关人物查看全部 (3)

相关产品查看全部 (10)

相关技术查看全部 (10)

相关报道查看全部 (1)