Jan, 2024

对Makelov等人(2023年)的“可解释性幻觉”论点的回应

TL;DR论文讨论了Makelov等人关于子空间交换干预方法以及其可能引起的“解释性幻觉”的论点,并指出认为这些所谓的幻觉是由于其训练和评估模式引起的,然后强调Makelov等人的例子和讨论无疑推动了解释性领域的发展。