Dec, 2022

处理长篇文档的全局记忆转换器

TL;DR本研究主要探讨了在 Transformer 模型中添加通用记忆单元对其性能的影响,通过使用遮掩语言建模和 HotpotQA 微调任务的实验数据表明,添加通用记忆单元可以提高模型性能。