AAAIJul, 2021

关于小型自监督对比模型的有效性研究:不使用蒸馏信号

TL;DR本文提出一种无需蒸馏信号即可训练自我监督小模型的方法,验证了小模型可以完成预文本任务且避免过拟合,但会普遍遭受过聚类问题,并提出了多种缓解过聚类的假设,通过验证技术的组合可在五种小型结构上达到基线性能的改进。