Routing-Aligned Fine-Tuning for Multilingual Downstream Tasks in Mixture-of-Experts Models 事件

Name: Routing-Aligned Fine-Tuning for Multilingual Downstream Tasks in Mixture-of-Experts Models
Start: 2026-05-28

PRODUCT_LAUNCH2026-05-28影响: MEDIUM

Routing-Aligned Fine-Tuning for Multilingual Downstream Tasks in Mixture-of-Experts Models arXiv:2605.28306v1 Announce Type: new Abstract: Mixture-of-Experts (MoE) models have emerged as a dominant paradigm for efficient LLM scaling, yet adapting them to non-English downstream tasks remains challenging. Existing fine-tuning approaches treat MoE models as monolithic learners, ignoring the heterogeneous routing structure that develops during pretraining. We validate across multiple MoE models and

人工智能

关系图谱

Routing-Aligned Fine-Tuning for Multilingual Downstream Tasks in Mixture-of-Experts Models 事件

相关公司查看全部 (10)

相关人物查看全部 (1)

相关产品查看全部 (10)

相关技术查看全部 (9)

相关报道查看全部 (1)