AAAIDec, 2015

学习无知、不一致智能体的偏好

TL;DR研究机器学习中先前观察到的人们的选择,作为贝叶斯反向规划的先验,建议了一种引入计划偏差和时序不一致性的算法,通过构造计划生成模型,分析了其对偏差和忠诚度的推断。人体实验表明,人们也会从系统性偏离最佳行为中解释选择,并考虑这些偏差。