Nov, 2022

对比式搜索与对比式解码在开放式文本生成中的实证研究

TL;DR本研究比较了两种最近提出的解码方法,即对比搜索(CS)和对比解码(CD),发现尽管 CS 在 MAUVE 指标上表现不佳,但在多样性和连贯性指标上大大超过 CD。人工评估显示,人类注释器普遍更喜欢 CS 而非 CD,MAUVE 与人工评估之间的矛盾表明 MAUVE 不准确反映人类偏好,需要开发更好的评估指标来确保生成结果的可复制性。