Jun, 2024

基于质量驱动数据选择的课程学习

TL;DR通过利用图像文字相互关系和模型困惑度评估选择数据的品质,本研究提出了一种利用两个属性在二维空间选择数据的数据选择方法。研究结果表明,相比于使用完整数据集,在五种常见能力上得到了显著提升,可以构建不同品质的多阶段子集以促进课程学习。