Feb, 2024

RORA: 强健自由文本理由评估

TL;DR通过评估条件性 V - 信息以及对容易被小型模型利用的敏感特征进行鲁棒性评估,我们提出了一种针对标签泄漏的强韧的自由文本基于理由的评估方法 RORA,它在评估人类编写、合成或模型生成的基于理由时提供了更可靠和准确的度量,尤其是对于标签泄漏展现出了鲁棒性。