关键词reinforcement learning model
搜索结果 - 2
- 基于交换的网络设施位置问题深度强化学习
该研究论文提出了一个基于交换的框架和一种新颖的深度强化学习模型,用于解决图上的设施位置问题和设施重新定位问题。与手工启发式方法相比,该方法在复杂图数据集上表现出更好的解决方案质量和运行时间,同时引入了一种图生成过程,以模拟带有需求的现实世界 - ACL利用积极情感引导增强学习方法促进多轮情感支持对话
本研究提出了一种新的情感支持对话范式 —— 正向情感引导,通过基于专家的混合增强学习模型,精细的情感调节以及对话连贯性的奖励设计,达到实现情感支持和维护对话连贯性的双重目标。实验结果证明了该模型在提高积极情感引导能力方面的优越性,同时也保持