Jun, 2023

基于异构知识的增强模块化强化学习

TL;DR通过使用调解者选择异质性模块和平稳地融合不同类型的知识,提出了增强型模块化强化学习 (AMRL) 框架,并引入了选择机制的变体,即记忆增强型调解者,以利用时间信息,评估结果表明增强传统模块化 RL 的其他形式的异质知识可以提高性能