Jul, 2024

如果不理解就不要使用:通过层间过滤器消除木马

TL;DR研究找到和解决大语言模型中出现的意外行为的困难,并针对注入的数据毒害特洛伊木马提供了普遍适用的方法以及实际实施方式。