Apr, 2025
大型语言模型能否检测重述和机器翻译中的内在幻觉?
Can LLMs Detect Intrinsic Hallucinations in Paraphrasing and Machine
Translation?
TL;DR本研究针对大型语言模型(LLMs)常见的幻觉现象进行探讨,评估其在重述和翻译任务中的内在幻觉检测能力。通过分析不同模型在各种任务和语言中的表现,研究发现模型性能在各种任务间存在差异,但在特定提示下表现一致,且自然语言推理模型的表现同样优异,表明LLM为基础的检测方法并非唯一选择。