超级模型生态系统：领域自适应视角

Aug, 2022

超级模型生态系统：领域自适应视角

Super-model ecosystem: A domain-adaptation perspective

Fengxiang He, Dacheng Tao

TL;DR本文旨在通过领域适应性建立新兴超级模型范例的理论基础，其中首先在大量数据上训练一个非常大的模型（即超级模型），然后将其适应于各种特定领域，以此来减少计算和数据成本及碳排放。我们将超模型范例建模为两阶段扩散过程，预训练阶段模型参数从随机初值扩散并收敛到稳定分布，而微调阶段模型参数则被传输到另一个稳定分布。通过 PAC-Bayesian 框架，我们建立了一个 O (1/sqrt (N)) 的一般化界限。理论发现，微调阶段的泛化误差在领域适应中起主导作用。此外，我们的理论表明泛化性能由一种新的度量决定，该度量基于所收敛局部最小值的协方差矩阵和位移，并表征源域和目标域之间的领域差异。

Abstract

This paper attempts to establish the theoretical foundation for the emerging super-model paradigm via domain adaptation, where one first trains a very large-scale model, {\it i.e.}, super model (or foundation mod

super-model paradigm domain adaptation two-stage diffusion process uhlenbeck-ornstein process generalization error

发现论文，激发创造

领域自适应理论概述：学习界限与理论保证调查

该论文综述了迁移学习中的一个具有代表性的子领域 —— 领域自适应，介绍了基于不同统计学习框架的学习界限等方面的理论研究现状。

Apr, 2020

优化游戏：通用模型的协商和适应

在本研究中，作者提出了一个精细调整过程的模型，其中一名通才将技术产品（即机器学习模型）提升到一定的性能水平，然后一名或多名领域专家将其适应于特定领域的使用。我们为一类相对通用的成本和收益函数条件下，表征了精细调整的博弈问题如何得出一种利润共享解决方案。我们观察到，任何潜在的领域专家都可能对技术的采用做出贡献、免费骑车或者放弃，我们提供了产生这些不同策略的条件。我们展示了基于谈判解和子博弈完美均衡的方法如何揭示公司在这类交互中的战略行为，我们发现即使一家公司的成本远高于另一家公司，利润共享仍然可能出现。我们还为一类通用效用函数的 Pareto 最优谈判安排提供了方法。

Aug, 2023

迁移学习下的模型选择限制

研究表明，在模型选择中，转移距离是一个新的复杂度项，但在分类中，自适应速率可能会非常缓慢，而需有关距离的知识的 oracle 速率则可以达到更快的速度。

Apr, 2023

神经语言模型的域自适应权衡

探讨了语言模型适应与机器学习理论的关系，研究了大型领域外训练集和小型领域内训练集之间的训练方法的优劣，提出了领域外预训练加上领域内微调比单独应用更为通用，并提出了基于数据选择的适应技术的公共框架。

Sep, 2021

单个测试样本跨域泛化学习

该论文提出了一种利用单个测试样本进行跨域泛化模型训练的元学习方法，将单个测试样本的自适应变形建模为一种变分贝叶斯推断问题，从而在无需额外数据的情况下实现了对每个测试样本的自动调整，并在多个领域泛化基准测试中取得了至少与现有最先进方法相当甚至更好的性能。

Feb, 2022

关于预训练语言模型的领域自适应和泛化：一项综述

本文介绍了近年来自然语言处理中预训练语言模型（PLMs）的最新进展，并为适应目标领域提供了一种有效的方法。考察了 PLMs 的应用问题并提出了域自适应方法的分类方案，包括输入扩充、模型优化和个性化等方法。

Nov, 2022

不要停止预训练：将语言模型适应于领域和任务

本研究通过研究不同领域和任务的分类模型，验证了在特定领域和任务上进行二次预训练（领域自适应和任务自适应预训练）可以显著提高性能，同时也发现多阶段适应预训练在任务表现上取得了大幅提升。

Apr, 2020

领域自适应简介

本文关注的是无监督领域适应问题，该问题中只在源域内提供标签。文章试图从不同角度解释领域适应的类别，并提出了一些成功的浅层和深层领域适应方法。

Oct, 2020

领域自适应的新 PAC-Bayesian 视角

研究 PAC-Bayesian 领域适应的问题：从源域学习一个专门针对目标域的多数表决模型。通过导出目标风险的上限，我们提供了一个新视角来控制误差度量和投票者不一致之间的权衡。我们根据这个结果推导了一个 PAC-Bayesian 的广义上限，并将其特化到线性分类器。最后，在实际数据上进行了实验。

Jun, 2015

低资源领域自适应的逐步微调

通过多阶段逐步微调的方式，不需要改变模型或学习目标，可以显著提高自然语言处理模型在目标领域的适应能力。

Mar, 2021