BriefGPT.xyz
Ask
alpha
关键词
dailydialog dataset
搜索结果 - 1
神经响应生成的反事实离线训练
本文提出采用反事实推理来探索潜在回应,并在 DailyDialog 数据集上实验证明在仿真产生回应时更优,训练反事实回应可以帮助探索潜在回应空间的高奖励区域。
PDF
4 years ago
Prev
Next