Sep, 2023

医学基础模型易受有针对性的错误信息攻击

TL;DR通过有针对性地操纵模型权重的 1.1%,我们能够向大规模语言模型中注入不正确的生物医学事实,并使其错误信息在模型的输出中传播,同时在其他生物医学任务上的性能保持不变。这种特殊的易受攻击性引发了在医疗保健环境中应用大规模语言模型时严重的安全与可信性问题,强调了需要强大的保护措施、全面的验证机制和严格管理对这些模型的访问,以确保它们在医疗实践中可靠且安全地使用。