ACLMay, 2024

揭示 NLG 评估器的致命弱点:由大型语言模型驱动的统一对抗框架

TL;DR通过引入黑盒对抗性评估框架 AdvEval,利用强大的语言模型作为数据生成器和金标评估器,自动优化对抗数据并产生强烈的人工评估与受害评估之间的不一致性,实现了对自然语言生成系统进行鲁棒性评估的研究。在 12 个受害评估器和 11 个自然语言生成数据集上的实验证明了 AdvEval 的有效性。