May, 2024

利用全球和本地统计信息进行数据估值

TL;DR数据评估在近年来引起了越来越多的关注,鉴于高质量数据在各种应用中的重要作用,特别是在机器学习任务中。本文探讨了全局和局部价值分布的特征,提出了一种基于所探测到的分布特征的新的数据评估方法,并提出了一种解决动态数据评估问题的新路径,通过制定一个整合全局和局部价值分布信息的优化问题。广泛的实验表明了我们提出方法的有效性和高效性,验证了全局和局部价值分布在数据评估中的重要潜力。