Oct, 2024

大语言模型是否比报道中更优秀?检测标签错误及其对模型性能的影响

TL;DR本研究解决了当前自然语言处理基准数据集标签质量不足的问题,探讨了如何利用大语言模型(LLMs)来检测数据集中可能存在的标签错误。研究表明,通过纠正这些标签错误,可以显著提升模型的性能,这表明大语言模型的错误多半是由于标签问题,而非模型本身的不足。