Oct, 2023

感知增强学习中的差分编码观测空间

TL;DR通过差分编码观察空间,将基于图像的观察重新解释为视频,并利用无损差分视频编码方案来压缩回放缓冲区,以降低记忆占用,提高学习性能和延迟。