Oct, 2023

深度强化学习中的层级采样过程对零样本推广的影响

TL;DR通过采用非均匀采样策略和自监督环境设计方法,解决深度强化学习中自主代理在新环境中泛化能力有限的问题。