reward inference | BriefGPT

关键词reward inference

搜索结果 - 5

通过正则化逆强化学习实现奖励可转移性
逆强化学习旨在从专家示范中推断出奖励，但奖励与最优策略不唯一，本文提出主角度作为衡量转移规律相似性和差异性的更精细度量，建立了两个关键结果：1）当学习来自至少两个转移规律明显不同的专家时，对任何转移规律的可转移性提供了足够条件；2）当从单个
PDFa month ago
图上的归纳奖励推理
我们研究了基于图的信息传播的奖励推断方法，利用有限人类奖励注释和可用数据构建了奖励传播图，并通过传导推断方法估计未标记数据的奖励，以此改善离线强化学习任务的性能。
PDF5 months ago
连续状态环境中的条件核模仿学习
我们提出了一种基于马尔科夫平衡方程和条件核密度估计的模仿学习框架，通过估计环境的转移动力学和满足环境的概率平衡方程来解决连续状态空间环境中的模仿学习问题，并在连续状态基准环境的一系列数值实验中展示了优于许多最先进的模仿学习算法的实证表现。
PDF10 months ago
关于奖励推断对错误人类模型的敏感性
从人类行为推断奖励函数是实现价值对齐的核心，然而需要人类行为的准确模型，我们在理论和实证研究中发现行为可能出现对抗性商业偏差，同时也能够识别出在合理假设下的奖励推断误差线性受人类模型误差影响的影响范围。
PDF2 years ago
IJCAI奖赏推断中的选择集错误规范化
本篇研究通过引入选择集调整分类，探讨机器人从人类反馈中推断出奖励函数时选择集被错误设定的后果对性能的影响，并发现部分错误设定并不影响结果，但在某些情况下，失配会极大地损害机器人的推断结果，因此希望我们的结果能够为实际的奖励推理带来更好的预测
PDF3 years ago