Learning to Adapt SFT Data for Better Reasoning Generalization 事件

Name: Learning to Adapt SFT Data for Better Reasoning Generalization
Start: 2026-05-27

PRODUCT_LAUNCH2026-05-27影响: MEDIUM

Learning to Adapt SFT Data for Better Reasoning Generalization arXiv:2605.26924v1 Announce Type: new Abstract: Large language models (LLMs) have achieved remarkable progress, with post-training playing a crucial role in enhancing their reasoning capabilities. Among post-training paradigms, supervised fine-tuning (SFT) is widely used: it leverages external data to provide dense supervision and enables efficient training. However, directly fine-tuning on expert data can hurt generalization when t

人工智能

关系图谱

Learning to Adapt SFT Data for Better Reasoning Generalization 事件

相关公司查看全部 (10)

相关人物查看全部 (3)

相关产品查看全部 (10)

相关技术查看全部 (9)

相关报道查看全部 (1)