Sep, 2024

大型语言模型中的反事实令牌生成

TL;DR本研究解决了大型语言模型在生成文本时缺乏反事实推理能力的问题。通过开发基于Gumbel-Max结构因果模型的令牌生成方法,使得模型能够以几乎不增加成本的方式进行反事实令牌生成。研究表明,该方法不仅易于实现,而且可用于偏见检测,揭示了大型语言模型构建的世界观中的有趣见解。