Jan, 2025

快速跨数据集剪枝:提高自然语言理解中的微调效率

TL;DR本研究解决了在多样数据集上进行任务特定微调时,数据集剪枝效率低下的问题。我们提出的快速跨数据集剪枝(SCDP)方法,通过使用TF-IDF嵌入和几何中位数快速评估样本重要性,并根据数据集大小进行适应性剪枝,显著减少了计算资源消耗。实验结果表明,该方法在多个不同任务和规模的数据集上表现出色。