Nov, 2019

自然语言推断的公平泛化任务设定

TL;DR本文提出了一个正式的公平概念,并利用人工数据集来展示标准神经模型在要求的泛化方面表现不佳,只有联合组合前提和假设的任务特定模型能够达到高性能,即使这些模型也不能完美解决任务。