Nov, 2023
误导性语义快捷键上的推理链路:没有幻觉,模型能走多远?
Deceiving Semantic Shortcuts on Reasoning Chains: How Far Can Models Go without Hallucination?
Bangzheng Li, Ben Zhou, Fei Wang, Xingyu Fu, Dan Roth...
TL;DR该研究探讨了大语言模型在推理过程中出现的错误思考路径和幻觉问题,并通过一种新的探测方法和基准测试提供了证据,揭示了语言模型存在语义关联和错误推理的问题。