Feb, 2024

忠实性与可信度:大型语言模型解释的(不)可靠性

TL;DR大型语言模型的自解释性及其在高风险决策中的忠诚度与可信度之间的矛盾。