Jun, 2024

评估零射击长上下文语言模型压缩

TL;DR在长语境下,评估零样本压缩技术对大型语言模型 (LLMs) 的有效性,发现在应用某些压缩方法时,计算错误的趋势会增加。提出一种假设来解释不同 LLM 压缩技术的不同行为,并探索减轻某些技术在长语境下性能下降的方法。