Dec, 2023

少即是多 —— 多任务强化学习的调度器 / 执行器原则

TL;DR通过引入调度员与执行员原则,以及设计原则和结构的改变,可以改善泛化性能并显著提高数据效率。