Oct, 2023
LongLLMLingua:通过提示压缩加速和增强长背景下的LLMs
LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios
via Prompt Compression
TL;DR通过压缩提示信息,提高大型语言模型对关键信息的感知能力,从而解决高计算/财务成本、延迟时间长和性能劣势等问题。在各种长篇上下文场景下,通过使用LongLLMLingua压缩的提示信息,大型语言模型的性能得到提高,成本降低,以及端到端延迟时间减少。