Mar, 2024

记忆之外:语言模型中随机内存访问的挑战

TL;DR通过合成任务,我们研究了生成式语言模型(例如 GPT-2)能否按顺序或随机访问其记忆,并发现记忆重述和置换等技术提高了随机访问能力,进而在问答任务中取得了显着的改进。