Oct, 2022

自我合理化是否有助于提高对错误相关性的稳健性?

TL;DR本论文研究以人类编写的基准解释为训练数据的自我合理化模型,探讨其对于解决任务的正确性、易解释性和鲁棒性等方面的影响。结果表明,在低资源环境下,自我合理化模型有可能提高模型的鲁棒性;但在高资源环境下,模型的鲁棒性有所下降。