通过势能视角探索模型的可迁移性
本文提出了一个基于能量的可转移性评估度量 (ETran),用于解决目标检测和图像分类中预训练模型的排名问题。ETran 通过能量得分、分类得分和回归得分来判断目标数据集对预训练模型是否为带内(IND)或带外(OOD)数据,并在分类、回归和目标检测任务上都适用,是首个提出目标检测任务的可转移性评估的研究。在四个基准测试和两个任务上的广泛实验证明,ETran 在目标检测和分类基准测试上的平均性能分别比先前的方法提高了 21% 和 12%,并在转移性评估方面达到了最新的成果。
Aug, 2023
现已大规模和大量可用的预训练模型,因此估计模型的迁移能力变得至关重要,本文针对这个问题进行了综述,并将其分为两个领域:无源模型迁移能力估计和有源模型迁移能力估计,提供了相关的分类和指导。
Feb, 2024
本研究通过建立一个包含各种结构、数据集和训练方法的大型目标检测器转移性基准,提出了一种高效的计算方式,同时评估分类和回归子任务,以及评估具有不同物体的任务。实验证明,相比于蛮力调整所有预训练检测器,我们的方法在不同目标领域下评估转移性能优于其他现有的方法,同时降低了 32 倍的时间和仅需 5.2% 的内存占用。
Mar, 2024
本文提出了一个简单而高效的方法来估计深度神经网络的迁移能力,该方法通过将深度神经网络投影到一个模型空间中,其中每个网络被视为一个点,这些点之间的距离通过它们产生的归因图的偏差来衡量。该方法比 Taskonomy 快数倍,同时保留了 Taskonomy 获得的与任务相关的拓扑结构。
Sep, 2019
研究表明,预训练模型可以应用于科学机器学习任务中的迁移学习,可在细调适当的预训练模型下,以比从头开始训练少得多的下游示例实现期望的准确度水平。模型的规模越大,用 fine-tuning 方法会获得更好的性能提升,这为 SciML 问题的建模奠定了基础。
Jun, 2023
本文通过分析在只微调模型最后一层的情况下分类任务的性能传输,提出了一种新颖的任务转移分析方法,该方法通过改变类先验分布、标签和特征空间的方法变换源分布,并利用 Wasserstein 距离、标签分布的条件熵以及源分布的带权损失等因素说明了传输性,同时提出了最小化转移上限的变换源任务的优化问题,通过对最新的预训练模型进行大规模实证研究,证明了本方法在预测传输性方面的有效性。
Jul, 2023
该研究重点研究了通过使用不同于传统方法的先前训练模型知识来改进视频分类的方法,简单而有效的调整模式在各种视频识别场景中达到了最先进的表现。
Jul, 2022
本文提出了一个实用性框架 Fennec,通过将所有模型和历史任务映射到一个 transfer-related 子空间中,以判断他们之间的可迁移性,并通过一个大型视觉模型来推断新任务在 transfer 空间中的表示,最后通过 rigorous testing 在两个基准测试上验证了框架的有效性。
Mar, 2024
本文提出了一个评估跨任务表示学习有效性的 H-score 度量方式,可以对在分类问题中从一个任务传递到另一个任务的表示的性能进行评估。使用实际图像数据进行的实验表明,该评价标准不仅与经验传递度量一致,而且在源模型选择和任务转移课程学习等应用中也非常有用。
Dec, 2022
本论文采用机器学习与热力学的形式联系,表征学到的表示在迁移学习中的质量;我们讨论了模型信息论函数,如速率、失真和分类损失如何位于凸平衡面上。我们提出了遵守约束的动态过程,例如,一种等分类过程,它在平衡面上进行速率和失真的交换以保持分类损失不变。我们演示了如何在保持分类损失不变的情况下,将表示从源数据集转移到目标数据集。最后,在标准图像分类数据集上提供了理论结果的实验验证。
Feb, 2020