如何选择转移模型?一项关于转移可行性估计的调查
通过大规模实验研究,聚合不同实验结果并提出 LogME 转移度量法,发现在语义分割场景中选择良好的源数据集、在图像分类场景中选择良好的源体系结构以及确定哪个目标任务最受益于给定的源模型的最佳转移度量法是 LogME、NLEEP 和 GBC,但没有一种单一的转移度量法能够在所有场景中表现最佳。
Apr, 2022
本文提出HASTE(HArd Subset TransfErability)方法,通过使用较难的目标数据子集来估计源模型转移到特定目标任务的可转移性,结合内部和输出表示方法提出两种技术来识别较困难的子集,从而可与任何现有可迁移度度量一起使用以提高其可靠性,实验结果表明,HASTE修改的指标与现有的可迁移度指标一致或更佳。
Jan, 2023
本文提出了一种新的分析方法和度量标准——基于Wasserstein距离的联合估计(WDJE),用于在统一的分类和回归问题中估计和确定可转移性,通过比较目标风险有无转移来促进决策,同时提出了一种容易理解和计算的目标风险上界,通过有限的目标标签关系目标风险与源模型性能、域和任务之间的Wasserstein距离关系,简化了目标风险的计算, 并将其推广到无监督设置中。实验结果表明,WDJE在图像分类和剩余寿命回归预测中的有效性,并且所提出的目标风险上界能够很好地估计目标转移风险。
May, 2023
我们提出了一种快速准确测量迁移能力的算法,通过测量类内特征方差来评估预训练模型在目标任务上的泛化能力,相比于之前的研究,我们的方法在选择前五个最佳模型上表现出色,并在17个案例中展现出更好的相关性。
Aug, 2023
提出了一种用于评估模型集合对下游任务的可转移性的新方法OSBORN,能够综合考虑图像领域差异、任务差异和模型集合的内聚性,相较于现有指标MS-LEEP和E-LEEP,该方法在图像分类和语义分割任务中表现出更好的性能。
Sep, 2023
我们提出了两种简单且计算高效的方法,基于线性回归模型的负正则化均方差误差来估计优化的目标模型的转移性,在准确性和效率两方面显著优于现有的最先进的回归可转移性估计器。
Dec, 2023
通过对现有可迁移性估计方法的全面调查和基于GLUE基准的详细实证研究,我们展示了现有方法的优点和缺点,并证明了H-Score在有效性和效率方面具有卓越性能。此外,我们还提出了在训练细节的考虑、文本生成的适用性以及与特定指标的一致性等困难,为未来研究方向提供了启示。
Dec, 2023