高维线性回归的统一迁移学习模型
本文提出了一种称为 UniTrans 的新方法,以统一模型和数据转移,通过增强的知识蒸馏从未标记的目标语言数据中利用可用信息,对比 4 种目标语言的基准数据集表明,UniTrans 显著优于现有的最先进方法。
Jul, 2020
我们提出了两种简单且计算高效的方法,基于线性回归模型的负正则化均方差误差来估计优化的目标模型的转移性,在准确性和效率两方面显著优于现有的最先进的回归可转移性估计器。
Dec, 2023
解决在稳健转移学习中由贝叶斯分类器的不确定性和目标与源分布之间弱可转移信号引起的挑战。我们介绍了一种称为 '' 不确定性水平 '' 的新量,用于衡量目标和源回归函数之间的差异,并提出了一种简单的转移学习过程。我们建立了一个一般定理,展示了这个新量与风险改进方面的学习可转移性是如何相关的。我们的提出的 ''Transfer Around Boundary''(TAB)模型,在平衡目标和源数据性能的阈值的基础上,既高效又稳健,在改进分类的同时避免了负转移。此外,我们还展示了 TAB 模型在非参数分类和逻辑回归任务上的有效性,达到了最优上限,与对数因子相匹配。模拟研究进一步支持了 TAB 的有效性。我们还提供了简单的方法来绑定过度的错误分类错误,无需在转移学习中专门的知识。
Oct, 2023
本文提出了一种基于表示转移的学习方法来构建目标模型,该方法包括利用不同源表示构建适应目标数据的表示以及使用获得的模型作为细调过程的初始化,从而为线性回归提供了一种可行的迁移学习框架。
May, 2023
我们提出了一种自适应迁移学习方法,可以在高维环境中处理特征维度大于样本大小的情况。通过使用一种新型的融合罚函数,配合能够根据可迁移结构自适应调整的权重,我们能够检测和聚合特征层面或样本层面的可迁移结构,从而选择性地融合可迁移信号并过滤掉不可迁移信号。此方法的有效性已经通过合成数据和真实数据的验证得到证明。
Mar, 2024
现已大规模和大量可用的预训练模型,因此估计模型的迁移能力变得至关重要,本文针对这个问题进行了综述,并将其分为两个领域:无源模型迁移能力估计和有源模型迁移能力估计,提供了相关的分类和指导。
Feb, 2024
在高维回归环境中,我们提出了一种具有新型融合正则化器的两步法,有效利用来自源任务的样本,提高对具有有限样本的目标任务的学习性能,并提供了目标模型估计误差的非渐近界限,表明所提方法对协变量转变的鲁棒性。我们进一步确定了估计器最小化优选的条件。此外,我们将该方法扩展到分布式环境,允许预训练和微调策略,仅需一轮通信,同时保持了集中式版本的估计率。数值测试验证了我们的理论,突出了该方法对协变量转变的鲁棒性。
Apr, 2024
本文提出了一种新的多源传递学习方法,它结合了源目标相似性和不同可靠性源之间的关系,并提出了一个综合的主动传递学习框架,包括分布匹配和不确定性采样,在合成和真实数据集上进行了广泛的实验,表明其在多项基准测试中优于其他现有模型。
Jul, 2018
稀缺的异常数据是学习准确的异常检测决策规则的一个关键障碍。虽然迁移学习方法在异常检测中取得了最近的经验成功,但关于从源异常检测任务向目标任务中传递知识的条件和方式的基本理解仍不清楚。本研究采用 Neyman-Pearson 分类的传统框架,假设可以访问一些相关的但不完美的异常数据,并给出了关于该问题的信息理论限制,在这些限制下,我们验证了自适应程序在原则上可以实现,即无需关于源和目标异常分布差异的先验信息。
Oct, 2023
我们的论文介绍了一种新颖的转移学习方法,即分布鲁棒优化(TransDRO),它破除了严格的相似性约束,并通过在不确定性集合内优化最具对抗性的损失来优化目标数据的预测性能。通过数值研究和多机构电子健康记录数据的分析,我们验证了 TransDRO 的稳健性和准确性,突显其在转移学习应用中作为强大工具的潜力。
Sep, 2023