Jun, 2024

隐藏式问题表征揭示大型语言模型内外的非事实性

TL;DR本研究通过使用轻量级探针从问题的隐藏表示中唤起 “语言模型是否知道” 的能力,对非真实反应预测(NFP)进行了广泛分析,发现非真实性探针在多个语言模型中采用类似模式,并提出了跨语言模型的有效迁移学习并使用问题对齐策略进行小批量训练以确保其效力。