BriefGPT.xyz
Ask
alpha
关键词
otacos
搜索结果 - 1
什么时候进行感知和控制?一种适应时间的连续时间强化学习方法
优化系统学习离散时间决策进程的强化学习算法,以减少与系统的交互次数并提高性能,同时提出了时间自适应控制和感知(TaCoS)框架以及 OTaCoS 模型算法。
PDF
a month ago
Prev
Next