Jun, 2023

动态系统的乐观主动探索

TL;DR本文探讨了如何对未知的动态系统进行探索以解决多个下游任务的优化问题,提出了一种使用概率模型来量化关于未知动态的认识不确定性的算法 OPAX,结果表明 OPAX 不仅在理论上具有可行性,在新的下游任务的零 - shot 规划上也表现良好。