Jun, 2024

非自回归模型词汇扩容用于高效生成式检索

TL;DR该论文研究了非自回归语言模型作为生成式检索的更高效的替代方法,并提出了 PIXAR,一种扩展目标词汇的新方法,通过包括多词实体和常见短语(高达 500 万个标记)来减少标记之间的依赖性,并通过推理优化策略在保持低推理延迟的同时实现了好于标准非自回归模型 31.0% 的相对改进 (MRR@10,MS MARCO 数据集)。