ACLJul, 2024

EconNLI: 对大型语言模型在经济推理上的评估

TL;DR评估大型语言模型在经济领域的知识和推理能力,发现它们在经济推理方面不够成熟且可能产生错误或虚构的结果,提出了经济事件的自然语言推理数据集(EconNLI)以增强评估方法,认识到在涉及经济推理和分析的关键决策中使用大型语言模型存在局限性。