多任务大模型设备调优

AAAIFeb, 2023

Device Tuning for Multi-Task Large Model

Penghao Jiang, Xuanchen Hou, Yinsi Zhou

TL;DR本文提出了 Device Tuning 方法来提高自注意力模型的计算效率，并通过压缩表示减少设备与云端之间的通信，有效支持多任务学习。

Abstract

unsupervised pre-training approaches have achieved great success in many fields such as Computer Vision (CV), Natural Language Processing (NLP) and so on. However, compared to typical deep learning models, pre-training or even fine-tuning the state-of-the-art →

unsupervised pre-training self-attention models multi-task learning representation compression device tuning

发现论文，激发创造

muNet: 将预训练的深度神经网络进化为可扩展的自动调整多任务系统

采用预训练深度神经网络层作为基块构建多任务学习系统，通过动态选择相关的先验知识、模型参数和超参数进行自动调优，控制模型规模实现高质量模型与较小的规模之间的权衡，并在 10 个多样化的图像分类任务中，相对于标准调优，提高了平均精度 2.39％而使用了每个任务 47％以上的参数。

May, 2022

DUET：一种无需调优的设备 - 云协作参数生成框架，用于高效设备模型泛化

本文通过提出一个新的对设备模型泛化的框架 DUET, 实现了不增加计算成本的 DMG 的改善，通过在强大的云服务器上部署，从而在不进行微调前提下，通过设备特定参数生成直接映射数据分布和参数。

Sep, 2022

视觉调整

本文调查了最近的大量工作，提供现有工作和模型的系统性和全面性概述，将最近的视觉微调技术分为五组：提示微调，适配器微调，参数微调和重新映射微调，并提供前瞻性预训练和视觉微调中的各种交互的激动人心的研究方向。

May, 2023

极简交互边缘调校：视觉适应的新范式

MIET（极简交互边缘调优）通过使用轻量级的基于注意力机制的适配器网络，利用预训练模型的中间特征的加和实现了信息传递效率、参数效率、计算和内存效率，同时在各种视觉适应测试中展示出有竞争力的结果。

Jun, 2024

Muppet: 带有预细调的大规模多任务表示

本文提出了预细调（pre-finetuning）的方法，是在语言模型预训练和微调之间增加一个大规模学习阶段，旨在促进学习出更好地适用于许多不同任务的表示。通过大规模的多任务学习，预细调在广泛的任务中显著提高了预训练鉴别器和生成模型的性能，并显著提高了微调的样本效率。

Jan, 2021

面向任务引导的预训练语言模型解耦调参

该研究提出一种名为任务引导分离微调的方法，通过从预训练的语言模型中分离特定任务的信号来增强表示的泛化能力，实验结果表明，该方法在自然语言处理方面表现出更好的效果。

Mar, 2022

预训练表示的双调谐

本文提出 Bi-tuning，一种细调深度学习模型的新方法，能同时利用监督和无监督预训练，并综合使用有标签数据的判别信息和无标签数据的数据结构，相较于现有策略，在精度上有了长足的提升。

Nov, 2020

SubTuning: 多任务学习的高效微调

本研究探讨了一种新的用于 fine-tuning 神经网络的方法，称为子集 fine-tuning，即只对部分层进行精细调整并锁定其余权重，该方法可以在不增加计算成本的情况下实现多任务的学习和推理，并在数据稀缺的情况下实现与完全 fine-tuning 模型相当甚至更好的性能。

Feb, 2023

硬件限制的小型四旋翼无人机上的设备端自监督学习视觉感知任务

通过在纳米无人机上进行设备学习，我们提出了解决领域转换问题的方法，并在实施中取得了重要进展。

Mar, 2024

推荐系统中基于标签纠正的设备端模型微调

本研究针对推荐系统中的 CTR 预测任务，研究了如何在移动设备上有效地进行本地微调，提出了一种新的标签修正方法，并通过离线评估和在线 A/B 测试证明了它的必要性和优越性。

Oct, 2022