Dec, 2023

个性化路径补权

TL;DR论文介绍了个性化路径补救(Personalized Path Recourse)这一新方法,旨在为代理生成补救路径,以实现期望的目标并保持与代理原始路径的高相似性,并根据代理的观察行为模式个性化定制新路径。该方法适用于纠正或改进行动或数据序列以达到预定目标的强化学习和监督学习设置,并在不同场景中进行了评估,显示出良好的结果。