What Are We Measuring in NLG? A Meta-Analysis of Evaluation Trends 2020-2025 事件

Name: What Are We Measuring in NLG? A Meta-Analysis of Evaluation Trends 2020-2025
Start: 2026-05-28

PRODUCT_LAUNCH2026-05-28影响: MEDIUM

What Are We Measuring in NLG? A Meta-Analysis of Evaluation Trends 2020-2025 arXiv:2601.07648v2 Announce Type: replace Abstract: As Natural Language Generation (NLG) dominates modern NLP, scalable evaluation remains a critical bottleneck. Consequently, LLM-as-a-judge (LaaJ) adoption has accelerated rapidly, appearing in more papers than human evaluation in 2025. This pivotal shift motivates a critical analysis of current evaluation practices. Overcoming the limits of rigid keyword filtering and

人工智能

关系图谱

What Are We Measuring in NLG? A Meta-Analysis of Evaluation Trends 2020-2025 事件

What Are We Measuring in NLG? A Meta-Analysis of Evaluation Trends 2020-2025 · 相关技术

相关技术