EMNLPOct, 2023

自然语言处理评估中的难题:从需要对每个基准进行 LLM 数据污染度测量谈起

TL;DR该论文讨论了自然语言处理任务的评估存在的问题,并提出了数据污染以及针对数据污染的自动检测和提示措施。