Apr, 2020

神经响应生成的反事实离线训练

TL;DR本文提出采用反事实推理来探索潜在回应,并在 DailyDialog 数据集上实验证明在仿真产生回应时更优,训练反事实回应可以帮助探索潜在回应空间的高奖励区域。