May, 2022

CORAL:用于训练对话生成模型的上下文响应可检索性损失函数

TL;DR本论文提出了一种新的损失函数 CORAL 来应对交流生成任务的独特挑战,该方法可以直接优化人类喜好生成的响应,从而避免了 CE 损失的局限性,取得了比不同规模的强状态基线模型更好的效果。