Nov, 2023

MAP 还未过时:通过去除退化性条件揭示真实的语言模型模式

TL;DR混合低熵噪声与自然语言生成模型的训练数据可以导致退化模式,因此建议将最大后验(MAP)解码应用于避免特定退化的条件模型分布,研究发现机器翻译模型和语言模型的长度条件模式比无条件模式更流畅和主题相关。