Sep, 2020

生成具有标签内聚力和良好形式的对抗性主张

TL;DR本文主要研究如何生成对于事实核查系统具有对抗性的攻击,使其保持着地面事实的意义和语义的有效性,为此采用了 HotFlip 攻击算法与条件语言模型相结合的方法,生成出了一批具有方向性和语义有效性的攻击。