跟踪与 LoRA: 更快的训练、更大的模型、更强的性能

Mar, 2024

跟踪与 LoRA: 更快的训练、更大的模型、更强的性能

Tracking Meets LoRA: Faster Training, Larger Model, Stronger Performance

Liting Lin, Heng Fan, Zhipeng Zhang, Yaowei Wang, Yong Xu...

TL;DR通过 LoRAT 方法，将 Vision Transformers (ViT) 应用于实验室级资源内的视觉跟踪，通过解决独特的挑战和潜在域差异，包括将位置嵌入分解为共享的空间嵌入和独立的类型嵌入，并设计了仅基于多层感知器 (MLP) 的自由锚定头进行适应，以提高性能并降低计算开销。

Abstract

Motivated by the parameter-efficient fine-tuning (PEFT) in large language models, we propose lorat, a method that unveils the power of larger Vision Transformers (ViT) for tracking within laboratory-level resourc

parameter-efficient fine-tuning lorat vision transformers visual tracking transformer-based trackers

发现论文，激发创造

ExPLoRA：参数高效的扩展预训练用于适应领域偏移的视觉变换器

通过使用 ExPLoRA 技术，在对卫星图像进行迁移学习时，只使用很少的参数数量，在无监督的预训练阶段只解冻 1-2 个预训练的 ViT 块和所有归一化层，然后通过 LoRA 微调所有其他层，最后只通过 LoRA 在新域上对模型进行微调，获得了基于先前完全训练和微调的 ViTs 的最先进结果。

Jun, 2024

FullLoRA-AT: 高效提升预训练视觉变换器的鲁棒性

通过使用学习性的 LNLoRA 模块和 FullLoRA-AT 框架，本文提出了一种参数高效的对 Vision Transformer 模型进行对抗微调，以有效提高模型的鲁棒性。在 CIFAR-10，CIFAR-100 和 Imagenette 数据集上进行的广泛实验证明了本文方法的优越性。

Jan, 2024

LoRA Land: 310 微调 LLM 模型媲美 GPT-4 的技术报告

LoRA 是一种使用较少参数和内存的训练方法，研究表明，在低秩适配器的支持下，LoRA fine-tuned 模型在多个任务上表现超过基准模型 34 个百分点和 GPT-4 10 个百分点；此外，他们开发了 LoRAX 多模型推理服务器，支持多个 LoRA fine-tuned 模型在单个 GPU 上运行，以展示使用多个专用 LLM 相对于单个通用 LLM 的质量和成本效益。

Apr, 2024

少为佳：参数高效微调提升医学视觉基础模型

通过应用参数高效微调（Parameter-efficient fine-tuning）方法于胸部放射学基础模型上，研究表明该方法在少于 1% 的可调参数下，比完全参数微调（full-parameter fine-tuning）方法在 18 个迁移学习任务中有更好的性能，在 NIH ChestX-ray14 数据集上获得了 80.6% 的 AUROC 分数，希望引起社区对于在医学成像任务中使用参数高效微调方法的更多关注。

Jan, 2024

Trans-LoRA: 迈向无数据条件下的可转移参数高效微调

通过使用合成数据集，我们提出了一种新的方法来无损地将低秩适配器模块从一个基准模型转移到另一个基准模型，这项方法能够在不同的基准模型族之间，甚至不同的参数优化方法之间，在各种任务上实现低秩适配器的转移。

May, 2024

VB-LoRA：基于向量库的极度参数高效的微调

通过使用 “divide-and-share” 范式并引入向量库，VB-LoRA 实现了极高的参数效率同时保持与当前最先进 PEFT 方法相当甚至更好的性能。

May, 2024

ShareLoRA: 共享低秩调整的参数高效和鲁棒大型语言模型微调

通过实施共享低秩适应（ShareLoRA）的方式，本研究介绍了一种优化预训练语言模型（PLMs）的参数有效微调（PEFT）的方法。在不同层级上策略性地部署 ShareLoRA，并对 self-attention 层的 Query、Key 和 Value 组件进行适应性调整，我们实现了训练参数数量和内存使用的大幅减少。同时，ShareLoRA 不仅在 RoBERTa、GPT-2、LLaMA 和 LLaMA2 等多种模型上保持了模型性能，还在分类和生成任务中表现出鲁棒性。相比标准的 LoRA 应用，它表现出卓越的迁移学习能力，并通过在层级间共享权重来减轻过拟合。我们的发现证明，ShareLoRA 能够有效提升参数效率，同时在不同的语言模型架构上保证可扩展和高质量的性能。

Jun, 2024

HydraLoRA：一种用于高效微调的非对称 LoRA 架构

通过一系列实验，我们发现了两个关键的见解，揭示了 LoRA 的训练和参数效率问题，基于这些见解，我们开发了 HydraLoRA，这是一个具有不对称结构的 LoRA 框架，消除了对领域专业知识的需求，我们的实验表明，HydraLoRA 优于其他 PEFT 方法，即使在训练和推断阶段依赖领域知识的情况下。

Apr, 2024

更多关注视觉语言跟踪

本文介绍一种基于 ConvNets 和多模态视觉语言 (VL) 的追踪方法，通过模态混合器（ModaMixer）和不对称的 ConvNet 搜索，学习新颖的统一自适应 VL 表示，仅使用 ConvNets 能够在 SOTA 追踪中表现出色，甚至超过几个基于 Transformer 的 SOTA 追踪器。

Jul, 2022

基于移动视觉变压器的视觉目标跟踪

使用 MobileViT 作为骨干网络并采用融合模板和搜索区域表示的新方法，我们提出了一种轻量级、准确和快速的跟踪算法。实验结果表明，我们的基于 MobileViT 的追踪器 MVT 在大规模数据集 GOT10k 和 TrackingNet 上的性能超过了最新的轻量级追踪器，并且具有较高的推理速度。此外，我们的方法在模型参数减少 4.7 倍并在 GPU 上运行速度为 DiMP-50 追踪器的 2.8 倍的情况下，胜过了流行的 DiMP-50 追踪器。

Sep, 2023