May, 2023

叙述 XL: 用于长期记忆模型的大规模数据集

TL;DR提出了一种通过 GPT 3.5 从 Project Gutenberg 中的书籍总结场景并创建阅读理解问题的方法,用于创建可以训练和评估长期记忆语言模型的数据集,并经过人工和模型的实验验证,证明该数据集可以诊断模型的记忆容量,并且不是现代语言模型的简单问题。