Sep, 2021

鲁棒可预测控制

TL;DR这篇研究论文提出了一种基于信息压缩的强化学习算法,通过最小化信息、建立自洽的潜在空间模型和策略来提高压缩性能,并在性能、鲁棒性和泛化性方面都有显著提升。