Sep, 2024
LanguaShrink:利用心理语言学减少令牌开销
LanguaShrink: Reducing Token Overhead with Psycholinguistics
TL;DR本研究针对大型语言模型在处理长提示时的计算成本与效率问题,提出了一种名为LanguaShrink的创新性提示压缩框架。该框架利用心理语言学原理和艾宾浩斯记忆曲线,实现任务无关的提示压缩,显著减少提示长度的同时保留关键信息,实验结果显示在保持语义相似性的情况下,压缩比可达26倍,并且比现有方法提高了1.43倍的端到端延迟性能。