Sep, 2023

基于模型的离线策略优化与对抗网络

TL;DR使用对抗学习建立具有更好泛化性能的转移模型,能够更准确地量化模型不确定性,并在广泛研究的离线强化学习基准测试中胜过现有最先进的对照方法。