Feb, 2023

可重复使用的分时机制

TL;DR本研究提出了 RSM,一种采用可重复组件、学习场景的 “槽位式” 表示和动态选择机制的模块化架构,其可以很好地处理场景中不同对象之间的相互作用,可以应用于多种下一步预测任务中,并且在 Atari 2600 游戏中表现出色。