Nov, 2023

增强的无监督强化学习中的自指

TL;DR提出了一种自我引用(Self-Reference)的方法,通过在预训练和微调模式中利用历史信息来增强强化学习智能体的性能,不仅在性能方面取得了最先进的结果,还提高了样本效率。