Apr, 2024

强制语言模型排除扩散分布

TL;DR今天的语言模型在随机输出方面表现不佳,本文提出了一种微调方法,鼓励语言模型产生分散的输出分布,使大型语言模型在合成数据集生成方面变得更实用。