Apr, 2024

HEAT: 头部层级参数高效调整视觉 Transformer 并利用泰勒展开法的重要性评分

TL;DR使用 Head-level Efficient Adaptation with Taylor-expansion importance score (HEAT) 方法,通过计算每个头部的重要性得分来高效微调视觉转换器(ViTs),这种方法在计算机视觉和参数高效转移学习方面取得了优越的性能。