Reasoning Matters: Mitigate Hallucination in Multimodal Large Reasoning Models via Reasoning-Conditioned Preference Optimization 事件

Name: Reasoning Matters: Mitigate Hallucination in Multimodal Large Reasoning Models via Reasoning-Conditioned Preference Optimization
Start: 2026-05-28

PRODUCT_LAUNCH2026-05-28影响: MEDIUM

Reasoning Matters: Mitigate Hallucination in Multimodal Large Reasoning Models via Reasoning-Conditioned Preference Optimization arXiv:2605.27906v1 Announce Type: new Abstract: Multimodal Large Reasoning Models introduce the reasoning paradigm, demonstrating strong capabilities on complex vision-language tasks. However, they still suffer from severe hallucinations. Existing training-based methods typically mitigate hallucinations through response-level direct preference optimization (DPO), wher

人工智能

关系图谱

Reasoning Matters: Mitigate Hallucination in Multimodal Large Reasoning Models via Reasoning-Conditioned Preference Optimization · 相关公司

arXivNONPROFIT

IRECNONPROFIT

EARNNONPROFIT

EATNONPROFIT

ACTNONPROFIT

RatioRESEARCH_INSTITUTE

Mila

chainCOMPANY

Paradigm

VIACOMPANY