BriefGPT.xyz
Ask
alpha
关键词
reward decomposition
搜索结果 - 4
为可解释强化学习进行因果状态精炼
本文介绍了一种扩展奖励分解方法的因果学习框架,通过利用信息论度量的解释目标来鼓励因果因素的三个关键属性:因果充分性、稀疏性和正交性,并通过提取智能体状态、动作或奖励之间的因果关系深入理解其决策过程,从而为行动选择提供更有意义和有洞察力的解释
→
PDF
6 months ago
AAAI
通过反事实行动结果解释强化学习代理
提出了一种名为 COViz 的本地解释方法,将代理选择的行为结果与对照行为结果进行可视化比较,并与奖励分解法进行了对比评估,结果显示两种方法的综合利用显著提高了参与者的性能。
PDF
7 months ago
高水平机器人解释的奖励分解探究
本文提出利用抽象动作和奖励分解技术的可解释学习框架,使得机器人动作的解释更易于人类理解,并通过两个场景的定量和定性分析,展示了该框架的有效性。
PDF
a year ago
将政策摘要与奖励分解相结合,解释强化学习代理
本研究探讨将局部和全局解释方法相结合,通过激励分解和 HIGHLIGHTS 两种解释方式,帮助用户理解强化学习算法在决策制定时行为的策略,并通过两个用户研究证明两种方法的显著优势。
PDF
2 years ago
Prev
Next