Jan, 2022

利用线性关系网络进行组合多对象强化学习

TL;DR本文提出一种基于关系归纳偏见的新型插入式模块,可使代理程序在学习固定的多对象设置中学习操作任务,并在输入对象数量改变时零样本泛化,解决了前人方法因其复杂度而无法泛化的问题。