EMNLPApr, 2021

多语言产品评论中的反事实检测数据集

TL;DR本文讨论了如何检测评论中的反事实语句所面临的问题,并通过构建包含英语、德语和日语评论的数据集,使用不同的文本表示方法和分类器来训练反事实检测模型,并发现这些模型对于基于线索短语的句子选择引入的选择偏差具有鲁棒性,同时证明对于该问题,使用机器翻译来创建多语言数据表现不佳,说明了该问题的语言特异性,这已经被忽视了。