CVPRNov, 2021

DyTox:使用动态令牌扩展的 Transformers 进行持续学习

TL;DR提出了一种基于 Transformer 架构和共享编码器 / 解码器框架的策略,采用动态扩展特殊标记以使解码器网络适用于任务分布,从而在大数据集上取得优异结果,且不需要超参数调整。