May, 2024

关于为主动大型语言模型提供反应提示的脆弱基础

TL;DR通过对输入提示的系统变化进行敏感性分析,我们发现 LLMs 的性能受到例示 - 查询相似度的影响,并且推理能力源于近似检索,而非内在推理能力。