VLM3: Vision Language Models Are Native 3D Learners 文章

ArXiv CS.CV2026-06-01NEWSen作者: Zhipeng Cai, Zhuang Liu, Yunyang Xiong, Zechun Liu, Vikas Chandra, Yangyang Shi