Oct, 2023

决策 ConvFormer: 元前馈中的局部过滤足以进行决策

TL;DR通过使用多实体并行处理的结构,本研究提出了一种名为 Decision ConvFormer(DC)的新型动作序列预测模型,它在标准的强化学习基准测试中表现出了最先进的性能,并且对数据的底层含义有更好的理解和增强的泛化能力。