关键词social value orientation
搜索结果 - 5
- RACE-SM: 基于强化学习的社交出口匝道合并的自主控制
提出了一种基于学习的新型加速和换道决策模型,该模型明确考虑了自我车辆及周围车辆的效用,以产生社会可接受的行为。仿真结果表明,考虑周围车辆在奖励函数设计中的重要性,并直接考虑并道对周围车辆的影响,该模型在避免事故、近距离避开和反社会行为方面与 - 大型语言模型的异构价值评估
本研究提出了 A2EHV,一种自动化对齐评估方法,旨在提高大型语言模型的价值合理性,并在异构价值系统下进行评估,结合社会心理学中的社会价值取向框架,对大型语言模型的价值合理性进行评估,观察到大型模型更倾向于与中性价值对齐。
- 多智能体系统中的社会价值取向和整体情感
本研究考察了在多智能体社会中,以整体情感调节社交偏好的效果。我们开发了 Svoie,一种基于已确定的社交价值导向(SVO)政策以及替代整体情感政策做决策的多智能体代理设计方法。我们在资源共享任务环境中进行了模拟实验,并将 Svoie 代理的 - 研究半合作驾驶员对公路总体流量的影响
本文研究了自主驾驶中的半合作行为以及社会价值导向的影响,提出了一种基于博弈论的迭代最优响应模型进行模拟,发现半合作行为对高速和利他型驾驶者的影响更为显著,而总体交通流量的影响相对较小。
- 混合动机强化学习中的社会多样性与社会偏好
该研究利用社会心理学中的互相依存理论,探究强化学习在混合动机游戏中的效果,发现代理人的群体异质性对于代理人的行为变化有着显著的影响,并在两个混合动机 Markov 游戏中得到实证结果。