Feb, 2025

DiffSampling:提高神经文本生成的多样性和准确性

TL;DR本研究针对大型语言模型在文本生成中重复训练数据和缺乏多样性的问题,提出了一种基于数学分析的改进解码方法。该方法通过利用连续排序概率之间的差异,增加低概率但准确词汇的生成机会,从而在多个任务中展现出优于现有方法的生成质量和多样性。