DV-SFT: Direct Vision Supervision for Fine-Grained Visual Understanding 文章

ArXiv CS.CV2026-05-27NEWSen作者: Jianfei Zhao, Feng Zhang, Xin Sun, Chong Feng, Bing Wang, Zhixing Tan