Disagreeing Rationales: Rethinking Classification and Explainability Evaluation in Hate Speech Detection 事件

Name: Disagreeing Rationales: Rethinking Classification and Explainability Evaluation in Hate Speech Detection
Start: 2026-06-01

PRODUCT_LAUNCH2026-06-01影响: MEDIUM

Disagreeing Rationales: Rethinking Classification and Explainability Evaluation in Hate Speech Detection arXiv:2605.31563v1 Announce Type: new Abstract: Human disagreement is ubiquitous and well-known in labeling. However, variation in explanations, captured through token-level human rationales, remains far less explored. At the same time, it is unclear how to best evaluate human labels and rationales -- or even how to best aggregate rationales beyond majority vote -- in light of this variation

人工智能

关系图谱

Disagreeing Rationales: Rethinking Classification and Explainability Evaluation in Hate Speech Detection 事件

相关公司查看全部 (9)

相关人物查看全部 (5)

相关产品查看全部 (10)

相关技术查看全部 (10)

相关报道查看全部 (1)