Aug, 2023

离散提示压缩与强化学习

TL;DR本研究提出了一种基于强化学习的离散提示压缩方法 (PCRL),通过使用计算效率高的策略网络直接编辑提示,实现对各种类型的语言模型以及解码器和编码器 - 解码器架构的灵活应用,同时减少平均令牌数量 24.6%,且保持性能不变。此外,通过多种分析,揭示了提示中令牌重要性的理解。