May, 2024

SirLLM: 流式无限保留 LLM

TL;DR通过使用流输入和令牌熵度量以及内存衰减机制,SirLLM克服了长文本输入对LLMs的内存限制,并在不需要调整的情况下,帮助LLMs在无限对话中保持更长时间的记忆。