CVPRApr, 2019

变分信息蒸馏用于知识迁移

TL;DR本论文提出了一种信息理论框架用于知识转移,将知识转移视为最大化教师和学生网络之间的互信息,将该方法应用于不同架构的网络间的知识转移,证明了其性能远超现有方法。