May, 2024
揭示NLG评估器的致命弱点:由大型语言模型驱动的统一对抗框架
Unveiling the Achilles' Heel of NLG Evaluators: A Unified Adversarial
Framework Driven by Large Language Models
TL;DR通过引入黑盒对抗性评估框架AdvEval,利用强大的语言模型作为数据生成器和金标评估器,自动优化对抗数据并产生强烈的人工评估与受害评估之间的不一致性,实现了对自然语言生成系统进行鲁棒性评估的研究。在12个受害评估器和11个自然语言生成数据集上的实验证明了AdvEval的有效性。