HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱探索
趋势分析
登录
注册
DV-SFT: Direct Vision Supervision for Fine-Grained Visual Understanding
文章
ArXiv CS.CV
2026-05-27
NEWS
en
作者: Jianfei Zhao, Feng Zhang, Xin Sun, Chong Feng, Bing Wang, Zhixing Tan
大语言模型
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
DV-SFT: Direct Vision Supervision for Fine-Grained Visual Understanding · 相关技术
相关技术
ORM
TTE
Multimodal Large Language Models (MLLMs)
ODE
LLM
language model
多模态
UCT
Token
Stan
SSE
SFT
Referring expression comprehension (REC)
Parts-of-Speech (POS) tags
Next-token prediction
NPU
MIT
large language models
ICT
HIS
For
DiT
Decode
Camouflaged object detection
ARG
ANN
Table