CVPRNov, 2021
DyTox:使用动态令牌扩展的 Transformers 进行持续学习
DyTox: Transformers for Continual Learning with DYnamic TOken eXpansion
Arthur Douillard, Alexandre Ramé, Guillaume Couairon, Matthieu Cord
TL;DR提出了一种基于 Transformer 架构和共享编码器 / 解码器框架的策略,采用动态扩展特殊标记以使解码器网络适用于任务分布,从而在大数据集上取得优异结果,且不需要超参数调整。