Sep, 2022

Chain of Explanation: 针对隐性仇恨言论生成更高质量自然语言解释的新提示方法

TL;DR该研究利用先进的生成语言模型来生成关于文本含有令人厌恶的原因的自然语言解释,并使用启发式词语和目标群体提出了 “解释链” 促进方法,由于提供了准确的目标信息,我们将 NLE 生成的 BLUE 成绩从 44.0 提高到 62.3。我们最后使用各种自动评估方法和人类信息的及清晰度得分来评估生成 NLE 的质量。