Oct, 2023
TRIAGE: 为改善回归问题的训练数据进行特征化和审计
TRIAGE: Characterizing and auditing training data for improved regression
Nabeel Seedat, Jonathan Crabbé, Zhaozhi Qian, Mihaela van der Schaar
TL;DRTRIAGE 是一个针对回归任务的数据表征框架,利用符合性预测分布为模型提供特定的评分方法,该方法能够分析个别样本的训练动态,并将样本按照模型的欠估、过估或准确估计进行分类;研究结果表明 TRIAGE 的特征描述结果具有一致性,并展示了其通过数据塑造 / 过滤来提高回归任务性能以及开启了数据集选择和特征获取方面的新方法。