Nov, 2017

幸福追求:智能体社会中的人格学习

TL;DR该研究采用基于心理分析数据的奖励训练Deep Q-Network模型训练出了四个拥有各自个性的agent,并研究了这些agents之间的互动。结果表明,当agent在与手工编码的AI进行测试时取得更高的幸福感时,与其他个性不同的agents进行竞争时会表现得更差,这表明测试时的高幸福感可能存在过拟合的情况。