May, 2023

KNN-LM 不会改善开放式文本生成

TL;DR研究插值检索增强语言模型的生成质量,插值检索增强的语言模型通过使用给定前缀的最相关检索进行插值来预测下一个词的分布,发现这种方法对于母猪鼻子的下一个词比较准确,但对于开放式的文本生成质量并没有相应的改善,同时发现对于模型生成的文本作为查询时,检索分布的熵增加较快,不够可靠。希望推动未来在检索增强语言模型的解码算法和插值策略方面的改进。