Mar, 2025

如何保护自己免受5G辐射的影响?调查大型语言模型对隐性错误信息的反应

TL;DR本研究针对大型语言模型(LLMs)潜在传播隐性错误信息的问题进行探讨。我们提出了ECHOMIST,这是首个综合基准,专门评估LLMs如何应对用户查询中嵌入的错误前提。研究表明,现有模型在识别和反驳隐性错误信息方面表现不佳,强调了进一步研究此类问题的迫切性。