Jul, 2024

提示压缩的基本限制:用于黑箱语言模型的率-失真框架

TL;DR本研究针对大型语言模型的提示压缩问题进行了形式化,并提出了一个框架来统一生成硬提示的令牌级压缩方法。我们导出了该设置的失真-率函数,并证明了现有压缩方案与最优策略之间存在巨大差距,提出了一种查询感知、可变率的适应方法,以缩小这一差距。