Mar, 2023

分布式远程学习中基于投影的潜在凝聚

TL;DR本文提出了一种 Data-Agnostic Consolidation (DAC) 双知识蒸馏方法,通过新的投影潜在蒸馏损失函数在潜在空间中蒸馏模型,从而在单个设备上实现了零成本的前向传递,进而在分布式持续学习情境中实现流模型的知识整合和转移,最终在各类数据集中达到了最先进的效果。