Feb, 2024

欺骗检测是否能更深入?欺骗推理的数据集、评估和基准

TL;DR为了解决数据匮乏的问题,本文提出一种新的数据收集方法,使用 GPT-4 模拟嫌疑人和警官之间的角色扮演,并将传统的欺骗检测任务扩展到欺骗推理,以提供更多的证据。这个数据集还可以评估当前大型语言模型的复杂推理能力,并作为进一步研究的推理基准。