ACLMay, 2024

RAID:用于机器生成文本检测器鲁棒评估的共享基准测试

TL;DR通过使用最大、最具挑战性的基准数据集 RAID,评估了机器生成文本检测器的领域外和对抗鲁棒性,并发现当前的检测器在对抗攻击、采样策略变化、重复惩罚和未知生成模型方面容易被欺骗。我们发布了数据集和工具,以促进进一步探索检测器的鲁棒性。