Jun, 2023

推理时干预:从语言模型中引出真实答案

TL;DR介绍了一种名为 Inference-Time Intervention 的技术,它通过在有限数量的注意头上遵循一组指南,在推理期间改变模型的激活来提高大型语言模型的真实性,该技术在 TruthfulQA 基准测试中显著提高了 LLaMA 模型的性能。