Sep, 2024

最具影响力子集选择:挑战、前景及未来

TL;DR本研究解决了机器学习模型训练数据对模型行为的影响归因问题,特别是无法捕捉样本集的复杂影响。提出了最具影响力子集选择(MISS)问题,并分析了现有方法的优缺点,发现影响基贪婪启发式算法在某些情况下的不足之处。实验证明了一种自适应算法能够有效捕捉样本间的相互作用,从而在复杂场景中提升性能。