LH-Bench: Skill-Grounded Evaluation of Long-Horizon Agents on Subjective Enterprise Tasks 文章

ArXiv CS.AI2026-06-01NEWSen作者: Abhishek Chandwani, Ishan Gupta

查看原文 →

LH-Bench: Skill-Grounded Evaluation of Long-Horizon Agents on Subjective Enterprise Tasks · 相关技术

暂无数据