Apr, 2024

在神经压缩文本上训练 LLMs

TL;DR本文探讨了在高度压缩的文本上训练大型语言模型(LLMs)的想法。通过提出等信息窗口这一新的压缩技术,我们展示了在神经压缩文本上有效学习的方法,该方法在规模上得到了改进,并在复杂度和推理速度基准测试中大大优于字节级基准。