Oct, 2022

基于分解的数据集精炼

TL;DR本文研究了数据集蒸馏领域,并提出了一种被称为HaBa的数据集分解方法,其探索将数据集分解为数据幻象网络和基础部分,利用两者之间的灵活组合使蒸馏数据具有指数信息增益,进一步提高了数据压缩结果的数据有效性和对跨体系结构的泛化能力。