Feb, 2024

生物医学问题回答中敌对实体的零样本采样

TL;DR基于参数化领域知识和对抗性样本的研究,通过在嵌入空间中进行权值抽样发现了多种对抗实体作为干扰因素,并证明了它在生物医学问题上对抗问答中相对于随机抽样的优势,同时揭示了对抗性实体在特征上明显不同的两个区域,且攻击成功地操纵了基于令牌的 Shapley 值解释,在对抗性环境中具有欺骗性。这些调查说明了 LLMs 领域知识的脆弱性,同时揭示了高容量模型标准评估的不足。