JAEGER: Joint 3D Audio-Visual Grounding and Reasoning in Simulated Physical Environments 事件

Name: JAEGER: Joint 3D Audio-Visual Grounding and Reasoning in Simulated Physical Environments
Start: 2026-05-26

PRODUCT_LAUNCH2026-05-26影响: MEDIUM

JAEGER: Joint 3D Audio-Visual Grounding and Reasoning in Simulated Physical Environments arXiv:2602.18527v2 Announce Type: replace Abstract: Current audio-visual large language models (AV-LLMs) are predominantly restricted to 2D perception, relying on RGB video and monaural audio. This design choice introduces a fundamental dimensionality mismatch that precludes reliable source localization and spatial reasoning in complex 3D environments. We address this limitation by presenting JAEGER, a fram

人工智能

关系图谱

JAEGER: Joint 3D Audio-Visual Grounding and Reasoning in Simulated Physical Environments 事件

相关公司查看全部 (10)

相关人物查看全部 (1)

相关产品查看全部 (10)

相关技术查看全部 (10)

相关报道查看全部 (1)