IJCAIMay, 2024

无已知变化点的非稳定环境中的行为感知深度强化学习方法

TL;DR我们的研究引入了行为感知检测和适应(Behavior-Aware Detection and Adaptation,BADA)创新框架,将环境变化检测与行为适应相结合。通过分析使用 Wasserstein 距离的行为之间的变化来识别环境变化,并根据变化的程度对模型进行行为规范化,实现对新环境的适应。一系列实验结果表明,相对于现有的几种算法,该研究表现更好,并揭示了解决这一长期难题的重要潜力。