Oct, 2024

大语言模型的提示压缩:综述

TL;DR本研究解决了大语言模型在复杂自然语言任务中对长格式提示的需求,从而导致的内存使用和推理成本上升的问题。通过对硬提示方法和软提示方法的比较,提出了一系列有效的提示压缩技术,并分析了它们的机制与适应性,为该领域的未来研究方向提供了重要见解。