Jul, 2024

TAGCOS:面向任务无关的梯度聚类核心集选择用于指令调整数据

TL;DR本研究解决了指令调整数据集逐渐增多所带来的计算资源需求问题,提出了一种新的核心集选择方法TAGCOS。该方法通过利用样本梯度作为数据表示,并结合聚类和贪心算法进行有效选择,实验结果显示仅选择5%的数据就能达到接近全数据集的性能,展示了其在大型模型中的应用潜力。