Jun, 2024

什么时候进行感知和控制?一种适应时间的连续时间强化学习方法

TL;DR优化系统学习离散时间决策进程的强化学习算法,以减少与系统的交互次数并提高性能,同时提出了时间自适应控制和感知(TaCoS)框架以及 OTaCoS 模型算法。