EMNLPOct, 2023
自然语言处理评估中的难题:从需要对每个基准进行 LLM 数据污染度测量谈起
NLP Evaluation in trouble: On the Need to Measure LLM Data Contamination for each Benchmark
Oscar Sainz, Jon Ander Campos, Iker García-Ferrero, Julen Etxaniz, Oier Lopez de Lacalle...
TL;DR该论文讨论了自然语言处理任务的评估存在的问题,并提出了数据污染以及针对数据污染的自动检测和提示措施。