Feb, 2023

让每个样本都有价值:自我影响在学习嘈杂自然语言处理数据中的稳定性与效用

TL;DR本文研究使用任务不可知的自我影响分数对训练数据进行清洗的有效性,通过分析其在捕捉自然异常值方面的功效来调查自我影响数据清洗对机器翻译、问答和文本分类等任务的改进程度,利用自我影响计算的最新方法和自动课程学习作为基础。