Sep, 2023

通过任务一致的分数-辨别特征分布建模进行持续行动评估

TL;DR连续学习的行动质量评估方法,通过任务一致的得分判别特征分布来减轻遗忘问题,并使用有限内存的特征-得分相关觉察重复数据,以及开发行动一般-特定图形来学习和解耦行动的知识。