Apr, 2023

具备自控制内存系统的大规模语言模型释放无限长度输入容量

TL;DR本文提出了 Self-Controlled Memory 系统,包括语言模型代理、记忆流和记忆控制器三个核心模块,可以扩展 Large-scale Language Models 的输入容量,使其能够处理超长文本,而且实验结果表明该系统能够使非优化多轮对话的模型达到与 ChatGPT 相当的效果,并在超长文本摘要或长期对话方面优于 ChatGPT。