Nov, 2023

用于Transformer神经网络高效训练和推理的位置一致性输入压缩

TL;DR使用输入压缩和位置一致性(ICPC)的新数据增强方法,对Transformer进行了改进,以提高泛化能力和训练效率,并减轻过拟合。ICPC通过在每个时期对每个训练样本应用不同级别的压缩,实现了更快的训练,同时通过提供不同的压缩级别来减轻过拟合。在四个不同的模态下,ICPC提供了基于压缩的数据增强方法,并在九个不同任务中提高了1%的准确性,同时加速了训练和推断。