ACLJun, 2024

像人一样规划:对话规划的双过程框架

TL;DR通过引入心理学中的双过程理论,我们提出了双过程对话规划(DPDP)框架,结合直觉策略模型和深思熟虑的蒙特卡洛树搜索机制,通过线下强化学习和增强的实时学习实现了效率和策略深度之间的动态平衡,并在各种对话任务中实验证实了 DPDP 在实现高质量对话和操作效率上的卓越性。