HugMap
人工智能
云计算
半导体
网络安全
企业软件
区块链
量子计算
生物科技
新能源与智能制造
智能穿戴
机器人
智能手机
图谱探索
趋势分析
登录
注册
Multimodal Large Language Model-Enabled Video Translation: A Role-Oriented Survey
文章
ArXiv CS.CV
2026-06-02
NEWS
en
作者: Bingzheng Qu, Kehai Chen, Xuefeng Bai, Min Zhang
自然语言处理
查看原文
→
关系图谱
概览
相关事件
相关公司
相关人物
相关产品
相关技术
Multimodal Large Language Model-Enabled Video Translation: A Role-Oriented Survey · 相关技术
相关技术
Multimodal Large Language Models (MLLMs)
context-aware speech generation
multimodal fusion
temporal reasoning
video understanding
multimodal reasoning
lip synchronization
text-to-speech (TTS)
machine translation
automatic speech recognition
LLM