Video-LLaVA: Learning United Visual Representation by Alignment Before Projection 论文

2024引用 231

Human Pose and Action RecognitionAdvanced Vision and ImagingAdvanced Image and Video Retrieval Techniques

Advanced Image and Video Retrieval Techniques Human Pose and Action Recognition Advanced Vision and Imaging

相关技术:Advanced Image and Video Retrieval Techniques Human Pose and Action Recognition

Video-LLaVA: Learning United Visual Representation by Alignment Before Projection · 作者

Bin Zhu

Bin Lin

Munan Ning

Jiaxi Cui

Yang Ye