Jul, 2023

弹性决策变换器

TL;DR本研究介绍了一种新的弹性决策变换器(EDT)方法,可以在测试时通过调整在 DT 中保留的历史长度来促进轨迹拼接,实现优化轨迹和跨越 DT 和 Q 学习方法之间的性能差距,表现出优越性能。