Nov, 2023

聚合、分解和微调:一种简单而有效的视觉 Transformer 因子调整方法

TL;DR在视觉转换器(ViT)的背景下,最近的研究进展揭示了一些张量分解参数有效微调方法(如 LoRA 和 FacT)的有效性。然而,这些方法在解决内部和跨层冗余的挑战方面存在问题。为了解决这个问题,我们引入了 EFfective Factor-Tuning(EFFT),这是一种简单而有效的微调方法。在 VTAB-1K 数据集中,我们的 EFFT 超过了所有基准,以仅有 0.28%的参数的全面微调中取得了 75.9%的 top-1 准确率的分类平均。考虑到 EFFT 的简洁性和有效性,它具有作为基础基准的潜力。代码和模型现在可以在指定的链接中获得。