BriefGPT.xyz
大模型
Ask
alpha
关键词
long-tailed data distributions
搜索结果 - 3
多阶段均衡蒸馏:解决序列级知识蒸馏中的长尾挑战
大语言模型(LLMs)在各种自然语言处理任务中有了显著的进展,但部署仍然需要大量的计算资源。我们介绍了一种名为 Multi-Stage Balanced Distillation(BalDistill)的框架,通过在固定的计算资源预算内动态
→
PDF
13 days ago
探索对比学习用于长尾多标签文本分类
我们进行了关于有监督对比学习在多标签文本分类中的影响以及如何构建稳健的表示空间的研究,提出了一种新的对比损失函数,并在三个多标签数据集上实现了显著的宏 F1 分数改进。
PDF
3 months ago
基于特征统计的长尾和非独立同分布数据的解耦联邦学习
本文探讨了尾部类别在几个客户端上稀疏分布的被忽视的情景,提出了一个基于功能统计的两阶段解耦合联邦学习框架(DFL-FS),用于加速收敛并提高特征学习能力,实验结果表明该方法在准确率和收敛速度上优于现有方法。
PDF
4 months ago
Prev
Next