ACLMay, 2024

使用决策转换器和大型语言模型实现心理咨询和心理疗法中的对话主题推荐

TL;DR通过离线强化学习,我们利用决策变压器架构在患者和心理健康专业人员之间的咨询对话中进行主题推荐,展示了优于基准强化学习方法的改进,并提出了一种新的系统来利用我们模型的输出作为相同任务的大型语言模型的合成标签进行微调。