通过势能视角探索模型的可迁移性

ICCVAug, 2023

通过势能视角探索模型的可迁移性

Exploring Model Transferability through the Lens of Potential Energy

Xiaotong Li, Zixuan Hu, Yixiao Ge, Ying Shan, Ling-Yu Duan

TL;DR通过模拟基于力学的物理模型，对模型的选择进行重新定义，并通过捕捉动态表示的运动来评估可迁移性，从而增强传统的模型评估方法并提高性能。

Abstract

transfer learning has become crucial in computer vision tasks due to the vast availability of pre-trained deep learning models. However, selecting the optimal pre-trained model from a diverse pool for a specific downstream task remains a challenge. Existing methods for measuring the

transfer learning pre-trained models model selection self-supervised models transferability

发现论文，激发创造

ETran: 基于能量的可迁移性评估

本文提出了一个基于能量的可转移性评估度量 (ETran)，用于解决目标检测和图像分类中预训练模型的排名问题。ETran 通过能量得分、分类得分和回归得分来判断目标数据集对预训练模型是否为带内（IND）或带外（OOD）数据，并在分类、回归和目标检测任务上都适用，是首个提出目标检测任务的可转移性评估的研究。在四个基准测试和两个任务上的广泛实验证明，ETran 在目标检测和分类基准测试上的平均性能分别比先前的方法提高了 21% 和 12%，并在转移性评估方面达到了最新的成果。

Aug, 2023

如何选择转移模型？一项关于转移可行性估计的调查

现已大规模和大量可用的预训练模型，因此估计模型的迁移能力变得至关重要，本文针对这个问题进行了综述，并将其分为两个领域：无源模型迁移能力估计和有源模型迁移能力估计，提供了相关的分类和指导。

Feb, 2024

预训练检测器的高效可迁移性评估

本研究通过建立一个包含各种结构、数据集和训练方法的大型目标检测器转移性基准，提出了一种高效的计算方式，同时评估分类和回归子任务，以及评估具有不同物体的任务。实验证明，相比于蛮力调整所有预训练检测器，我们的方法在不同目标领域下评估转移性能优于其他现有的方法，同时降低了 32 倍的时间和仅需 5.2% 的内存占用。

Mar, 2024

基于属性映射的深度模型可迁移性

本文提出了一个简单而高效的方法来估计深度神经网络的迁移能力，该方法通过将深度神经网络投影到一个模型空间中，其中每个网络被视为一个点，这些点之间的距离通过它们产生的归因图的偏差来衡量。该方法比 Taskonomy 快数倍，同时保留了 Taskonomy 获得的与任务相关的拓扑结构。

Sep, 2019

走向科学机器学习的基础模型：特征缩放与转移行为表征

研究表明，预训练模型可以应用于科学机器学习任务中的迁移学习，可在细调适当的预训练模型下，以比从头开始训练少得多的下游示例实现期望的准确度水平。模型的规模越大，用 fine-tuning 方法会获得更好的性能提升，这为 SciML 问题的建模奠定了基础。

Jun, 2023

大规模预训练分类器任务可转移性分析

本文通过分析在只微调模型最后一层的情况下分类任务的性能传输，提出了一种新颖的任务转移分析方法，该方法通过改变类先验分布、标签和特征空间的方法变换源分布，并利用 Wasserstein 距离、标签分布的条件熵以及源分布的带权损失等因素说明了传输性，同时提出了最小化转移上限的变换源任务的优化问题，通过对最新的预训练模型进行大规模实证研究，证明了本方法在预测传输性方面的有效性。

Jul, 2023

重新审视分类器：将视觉语言模型应用于视频识别

该研究重点研究了通过使用不同于传统方法的先前训练模型知识来改进视频分类的方法，简单而有效的调整模式在各种视频识别场景中达到了最先进的表现。

Jul, 2022

下游微调的预训练模型建议

本文提出了一个实用性框架 Fennec，通过将所有模型和历史任务映射到一个 transfer-related 子空间中，以判断他们之间的可迁移性，并通过一个大型视觉模型来推断新任务在 transfer 空间中的表示，最后通过 rigorous testing 在两个基准测试上验证了框架的有效性。

Mar, 2024

任务迁移学习中可迁移性的信息论方法

本文提出了一个评估跨任务表示学习有效性的 H-score 度量方式，可以对在分类问题中从一个任务传递到另一个任务的表示的性能进行评估。使用实际图像数据进行的实验表明，该评价标准不仅与经验传递度量一致，而且在源模型选择和任务转移课程学习等应用中也非常有用。

Dec, 2022

表示学习的自由能原理

本论文采用机器学习与热力学的形式联系，表征学到的表示在迁移学习中的质量；我们讨论了模型信息论函数，如速率、失真和分类损失如何位于凸平衡面上。我们提出了遵守约束的动态过程，例如，一种等分类过程，它在平衡面上进行速率和失真的交换以保持分类损失不变。我们演示了如何在保持分类损失不变的情况下，将表示从源数据集转移到目标数据集。最后，在标准图像分类数据集上提供了理论结果的实验验证。

Feb, 2020