Mar, 2025

有限观察下的零样本动作泛化

TL;DR本研究解决了强化学习中代理面对未见动作时难以泛化的问题,提出了一种新的零样本框架AGLO,通过有限观察提取动作表征,并利用增强的合成表征学习策略。实验结果表明,该框架在多个基准任务中显著超越了目前的最先进方法,展现了其在新动作泛化中的有效性。