Oct, 2020

探究对话回应中的人身攻击

TL;DR本文提供了 ad hominems 的分类方法,并从语料库中提取样本来讨论人类和对话系统在Twitter上对特定话题的回应。本文还提出了一种约束解码技术,以减少生成的ad hominems数量。结果表明,Marginalized communities 的讨论会导致人类和DialoGPT的回应都生成更多的ad hominems,但是有约束条件的解码技术可以使得生成的对话回应中ad hominems更少。