BriefGPT.xyz
大模型
Ask
alpha
关键词
bitfit
搜索结果 - 3
大型预训练语言模型的高效微调方法的实证分析
为下游任务优化大型预训练语言模型仍然是自然语言处理中的一个关键挑战。本文通过实证分析比较了两种高效微调方法 ——BitFit 和适配器模块与标准的全模型微调。在 GLUE 基准数据集(MRPC、COLA、STS-B)上进行的实验证明了几个关
→
PDF
6 months ago
测试时训练语音
本文研究了测试时间训练(TTT)在处理语音应用中的分布偏移问题的应用。我们引入分布偏移到标准语音分类任务的测试数据集中,并探索了测试时间训练(TTT)如何帮助调整到分布偏移。在我们的实验中,包括背景噪声和语音中的性别和年龄等自然变化引起的分
→
PDF
9 months ago
ACL
BitFit: 面向基于 Transformer 的掩码语言模型的简单参数高效微调
介绍了 BitFit 方法,该方法在模型的偏置项(或其中的子集)被修改时进行了稀疏微调。使用小到中等规模的训练数据,将 BitFit 应用于预训练的 BERT 模型与整个模型微调相比具有竞争力(有时甚至更优)。对于更大的数据,该方法与其他稀
→
PDF
3 years ago
Prev
Next