CRaSh：聚类、剪枝和共享增强细调，无需完整大型语言模型

EMNLPOct, 2023

CRaSh：聚类、剪枝和共享增强细调，无需完整大型语言模型

CRaSh: Clustering, Removing, and Sharing Enhance Fine-tuning without Full Large Language Model

Kaiyan Zhang, Ning Ding, Biqing Qi, Xuekai Zhu, Xinwei Long...

TL;DR借助 CRaSh 方法，通过探索 Large Language Models (LLMs) 的模块化结构和表示相似性，本文研究了 Offsite-Tuning (OFT) 技术及其与后端模拟器之间的转换，提高其性能并解决隐私问题。研究发现模型大小会导致 LLMs 内层面的唯一模块结构的出现，并注意到隐含的表示和中间预测方面的微妙变化。实验结果证明 CRaSh 和 OFT 的有效性，且细调尝试的结构优化解具有线性连通性。

Abstract

instruction tuning has recently been recognized as an effective way of aligning large language models (LLMs) to enhance their generalization ability across various tasks. However, when tuning publicly accessible,

instruction tuning large language models offsite-tuning representation similarity emulators

发现论文，激发创造

连线：针对黑盒图像 - 语言模型的协作微调

该论文提出了一种名为 CraFT 的协作微调方法，用于将黑盒预训练视觉语言模型应用于下游任务，通过仅获得输入提示和输出预测来优化模型，并在少样本分类上展示出显著的结果。

Feb, 2024

离线调整：无需完整模型的迁移学习

本文提出一种名为 Offsite-Tuning 的隐私保护和高效的迁移学习框架，可以适应亿级基础模型到下游数据，同时保留各方的隐私，比现有的需要访问全部模型权重的微调方法在计算上更加高效。

Feb, 2023

大型语言模型（LLM）在低资源环境中不同有效微调方法的比较分析

该研究探讨了大型语言模型的细调策略，发现可替代方法在领域外泛化方面与标准方法相媲美，强调了对有效提示的需求，并针对可用资源和任务适应性进行合适的细调方法选择。

May, 2024

平衡专业性和多功能性：一种用于监督微调大型语言模型的由粗到细的框架

CoFiTune 是一种粗 - 细调整框架，通过使用树搜索算法和软掩码机制来解决领域专精性和多功能性之间的平衡问题，以提高模型在各种任务上的性能。与基准方法相比，CoFiTune 在整体评估中始终表现出色，并且在 13B 模型上提供了约 14% 的多功能性改进和微小的专精性损失。通过对 LLMs 中的信息传递过程进行进一步分析，我们提供了一种推测性的洞见，以解释所提出的方法的有效性。

Apr, 2024

利用大型语言模型进行代码生成的参数高效微调技术探究

通过对大规模语言模型进行参数高效微调技术的研究，本文在自动化代码生成场景下全面研究了这些技术对大规模语言模型的影响，实验结果表明这些技术在减轻计算负担和提高性能方面表现优越，为软件工程场景中的更广泛应用开启了机会。

Aug, 2023

CrossTune: 基于黑盒的标签增强的小样本分类

通过引入一种称为 CrossTune 的标签增强的交叉注意力网络，该网络在输入文本序列和任务特定标签描述之间建模语义相关性，本研究在少样本文本分类的背景下检验了 CrossTune 的有效性。通过使用 ChatGPT 生成额外的训练数据以提高 CrossTune 的泛化能力，并通过实验验证提出的方法相较于以往梯度自由黑盒调优方法平均提升了 5.7%，即使不使用 ChatGPT 增强数据，CrossTune 的性能也优于或与以往黑盒调优方法相当，这表明了我们方法的有效性。

Mar, 2024

LoFT：用于提高对大型语言模型的对抗攻击的可转移性的本地代理微调

本研究提出了局部微调（LoFT）方法，通过在词汇 - 语义邻近的有害查询中微调代理模型，减小代理模型与目标模型之间的差异，从而提高攻击的成功率。实验证明，局部微调代理模型能够提高攻击的传递性和攻击成功率。

Oct, 2023

HFT: 大型语言模型的半微调

通过定期重置部分参数，半精调可以恢复一些原始知识，并且在大规模语言模型中减轻了遗忘问题，同时在一系列下游基准测试中取得了最佳性能。

Apr, 2024

在大型语言模型中培养孩子：朝着有效和具有普适性的微调

本篇文章提出了名为 Child-Tuning 的 fine-tuning 技术，通过在反向传播过程中遮盖非子网络的梯度来更新大型预训练模型的子网络的子集，实验结果表明 Child-Tuning 在 GLUE 基准测试的各个下游任务中始终优于普通 fine-tuning，平均分数高出 1.5~8.6 分。此外，领域转移和任务转移的实证结果表明，Child-Tuning 可以大幅提高泛化性能。

Sep, 2021

基于学习的子空间投影器的通用 GPU 上超参微调 LLM 的实用卸载

通过学习稀疏压缩器和新颖的分层通信调度，我们提出了一个离线框架 LSP_Offload，能够在普通硬件上以接近原生速度进行大型语言模型的微调，从而在受限的内存条件下显著提高微调吞吐量并缩短微调时间。

Jun, 2024