ACLMay, 2021

改变数据,改变世界

TL;DR该研究论文讨论了关于 NLP 在深度学习模型和训练数据上的投资,目前我们的模型学到了很多假的模式、社会偏见和标注错误现象。虽然算法解决方案的成功有限,但还有一种替代方案被积极讨论,即更加细心地设计数据集来传递特定的信号,本文探讨了有关数据整理的正反两面观点,并认为基本上数据整理已经在发生和改变世界,问题只在于我们想要在这个过程中投入多少思考。