BriefGPT.xyz
Ask
alpha
关键词
preference inference
搜索结果 - 2
多目标强化学习中基于动态权重的演示偏好推断方法
该研究提出了一种基于动态权重的偏好推断算法,通过观察环境中的行为轨迹,能够推断多目标决策问题中代理人的偏好,实验结果表明其相较于现有方法能够显著提高推断效率和准确性。
PDF
a year ago
AAAI
学习无知、不一致智能体的偏好
研究机器学习中先前观察到的人们的选择,作为贝叶斯反向规划的先验,建议了一种引入计划偏差和时序不一致性的算法,通过构造计划生成模型,分析了其对偏差和忠诚度的推断。人体实验表明,人们也会从系统性偏离最佳行为中解释选择,并考虑这些偏差。
PDF
9 years ago
Prev
Next