Apr, 2024

大型语言模型对无关输入的响应会如何被扭曲?

TL;DR通过检索外部知识数据库,大语言模型在许多知识密集型任务中展示出增强的能力。然而,由于当前检索系统的固有缺陷,存在于排名靠前段落中的信息可能是不相关的。本文全面研究了 LLMs 对不同类型不相关信息在各种条件下的鲁棒性,通过构建高质量的不相关信息框架,展示了当前解决不相关信息的方案在提高 LLMs 对这些干扰的鲁棒性方面存在局限性。