May, 2024

可证明的对比式继续学习

TL;DR通过对前一任务的训练损失进行理论分析建立了性能保证的理论解释并提出了一种新的自适应蒸馏系数的对比式连续学习算法CILA,该算法在标准基准测试中取得了显著的改进和最新的最佳性能。