Apr, 2021

关于发现和移除语言数据中瑕疵的能力问题

TL;DR本文提出“能力问题”类算法,理论分析了如何检测出数据集中的伪相关性问题。通过统计学上的方法,对自然语言处理中数据集偏见及其对模型的不良影响提出解决方法。