Oct, 2023

LongLLMLingua:通过提示压缩加速和增强长背景下的 LLMs

TL;DR通过压缩提示信息,提高大型语言模型对关键信息的感知能力,从而解决高计算 / 财务成本、延迟时间长和性能劣势等问题。在各种长篇上下文场景下,通过使用 LongLLMLingua 压缩的提示信息,大型语言模型的性能得到提高,成本降低,以及端到端延迟时间减少。