Oct, 2024

语言模型词汇关键表示空间中的关联与导航

TL;DR本研究解决了语言模型解码中关键表示分布对下一标记预测分布的影响,尤其是键之间的相似性可能引发虚假相关的问题。论文提出了一种新的上下文方法,通过逐步将查询表示推离已探索区域,显著提高了解码的多样性和生成结果的自一致性。这一方法在知识探测任务中的实验结果表明,其对提高生成的多样性和准确性具有良好效果。