Sep, 2023

通过前瞻目标增强大型语言模型引发的面向任务的对话系统

TL;DRProToD 是一种预测未来对话动作并结合目标导向奖励信号来增强对话系统的方法,通过基于目标导向的对话模拟评估方法,可以在仅使用 10% 的数据的情况下实现比以前的全监督模型更好的性能,同时提高用户满意度和效率。