高维线性回归的统一迁移学习模型

Jul, 2023

高维线性回归的统一迁移学习模型

Unified Transfer Learning Models for High-Dimensional Linear Regression

Shuo Shuo Liu

TL;DR该研究开发出一种称为 UTrans 的可解释性统一转移学习模型，它可以检测可转移的变量和源数据，并基于假设检验提出源检测算法来排除不可转移的数据，通过多次实验比较预测误差和解释性等因素，表明 UTrans 相对于现有的算法具有较低的误差和更好的解释性，并将其应用于美国代际流动数据并将其与经典机器学习算法进行比较。

Abstract

transfer learning plays a key role in modern data analysis when: (1) the target data are scarce but the source data are sufficient; (2) the distributions of the source and target data are heterogeneous. This paper develops an interpretable unified →

transfer learning interpretable model source detection algorithm estimation error bounds heterogeneous data

发现论文，激发创造

UniTrans: 统一模型转移和数据转移，利用未标记的数据进行跨语言命名实体识别

本文提出了一种称为 UniTrans 的新方法，以统一模型和数据转移，通过增强的知识蒸馏从未标记的目标语言数据中利用可用信息，对比 4 种目标语言的基准数据集表明，UniTrans 显著优于现有的最先进方法。

Jul, 2020

回归任务的简单可迁移性估计

我们提出了两种简单且计算高效的方法，基于线性回归模型的负正则化均方差误差来估计优化的目标模型的转移性，在准确性和效率两方面显著优于现有的最先进的回归可转移性估计器。

Dec, 2023

具有不可靠源数据的鲁棒传输学习

解决在稳健转移学习中由贝叶斯分类器的不确定性和目标与源分布之间弱可转移信号引起的挑战。我们介绍了一种称为 '' 不确定性水平 '' 的新量，用于衡量目标和源回归函数之间的差异，并提出了一种简单的转移学习过程。我们建立了一个一般定理，展示了这个新量与风险改进方面的学习可转移性是如何相关的。我们的提出的 ''Transfer Around Boundary''（TAB）模型，在平衡目标和源数据性能的阈值的基础上，既高效又稳健，在改进分类的同时避免了负转移。此外，我们还展示了 TAB 模型在非参数分类和逻辑回归任务上的有效性，达到了最优上限，与对数因子相匹配。模拟研究进一步支持了 TAB 的有效性。我们还提供了简单的方法来绑定过度的错误分类错误，无需在转移学习中专门的知识。

Oct, 2023

基于多个预训练模型的线性回归表示迁移学习

本文提出了一种基于表示转移的学习方法来构建目标模型，该方法包括利用不同源表示构建适应目标数据的表示以及使用获得的模型作为细调过程的初始化，从而为线性回归提供了一种可行的迁移学习框架。

May, 2023

AdaTrans：基于特征和样本的高维回归自适应迁移学习

我们提出了一种自适应迁移学习方法，可以在高维环境中处理特征维度大于样本大小的情况。通过使用一种新型的融合罚函数，配合能够根据可迁移结构自适应调整的权重，我们能够检测和聚合特征层面或样本层面的可迁移结构，从而选择性地融合可迁移信号并过滤掉不可迁移信号。此方法的有效性已经通过合成数据和真实数据的验证得到证明。

Mar, 2024

如何选择转移模型？一项关于转移可行性估计的调查

现已大规模和大量可用的预训练模型，因此估计模型的迁移能力变得至关重要，本文针对这个问题进行了综述，并将其分为两个领域：无源模型迁移能力估计和有源模型迁移能力估计，提供了相关的分类和指导。

Feb, 2024

TransFusion：高维回归的协变量漂移鲁棒迁移学习

在高维回归环境中，我们提出了一种具有新型融合正则化器的两步法，有效利用来自源任务的样本，提高对具有有限样本的目标任务的学习性能，并提供了目标模型估计误差的非渐近界限，表明所提方法对协变量转变的鲁棒性。我们进一步确定了估计器最小化优选的条件。此外，我们将该方法扩展到分布式环境，允许预训练和微调策略，仅需一轮通信，同时保持了集中式版本的估计率。数值测试验证了我们的理论，突出了该方法对协变量转变的鲁棒性。

Apr, 2024

迈向更可靠的迁移学习

本文提出了一种新的多源传递学习方法，它结合了源目标相似性和不同可靠性源之间的关系，并提出了一个综合的主动传递学习框架，包括分布匹配和不确定性采样，在合成和真实数据集上进行了广泛的实验，表明其在多项基准测试中优于其他现有模型。

Jul, 2018

监督异常传递学习中的严格率

稀缺的异常数据是学习准确的异常检测决策规则的一个关键障碍。虽然迁移学习方法在异常检测中取得了最近的经验成功，但关于从源异常检测任务向目标任务中传递知识的条件和方式的基本理解仍不清楚。本研究采用 Neyman-Pearson 分类的传统框架，假设可以访问一些相关的但不完美的异常数据，并给出了关于该问题的信息理论限制，在这些限制下，我们验证了自适应程序在原则上可以实现，即无需关于源和目标异常分布差异的先验信息。

Oct, 2023

分布稳健的迁移学习

我们的论文介绍了一种新颖的转移学习方法，即分布鲁棒优化（TransDRO），它破除了严格的相似性约束，并通过在不确定性集合内优化最具对抗性的损失来优化目标数据的预测性能。通过数值研究和多机构电子健康记录数据的分析，我们验证了 TransDRO 的稳健性和准确性，突显其在转移学习应用中作为强大工具的潜力。

Sep, 2023