Sep, 2024

DetoxBench:大型语言模型多任务欺诈与滥用检测基准

TL;DR本研究关注大型语言模型在欺诈与滥用检测领域的应用不足,提出了一套全面的基准评估工具,以评估其在多种现实场景下的表现。研究发现,尽管大型语言模型在个别欺诈和滥用检测任务中表现良好,但在需要细致的语用推理的任务上表现不佳,这为其在高风险应用中的负责任发展提供了重要启示。