Apr, 2023

风险敏感和鲁棒的基于模型的强化学习和规划

TL;DR本研究主要关注序列决策算法中的不确定性和风险问题,通过探索规划和强化学习两种方法,尤其是面向基于模型算法的研究,旨在缓解epistemic和aleatoric不确定性问题。