Dec, 2022

动量解码:以图探索为基础的开放式文本生成

TL;DR本文提出一种新的解码方法 —— 动量解码,将生成开放式文本视为有向图中的探索过程,同时鼓励语言模型在当前图之外贪心地探索新节点,并允许其通过预定义的抵抗函数降低动量回到现有节点,本方法在三个基准测试中表现出与现有技术相当的性能,且具有明显提高的推理速度和计算 FLOPs。