ACLMar, 2021

ToxCCIn: 毒性内容分类与解释能力

TL;DR本文提出一种改进 transformer-based models 解释性的技术,通过假设一篇文章至少和其最有毒的部分一样有毒,并将其纳入训练过程来提高模型的可解释性,实验证明该方法优于逻辑回归分析,具备更高的质量和解释性。