BriefGPT.xyz
May, 2023
通过任何回归模型检测数值数据中的错误
Detecting Errors in Numerical Data via any Regression Model
HTML
PDF
Hang Zhou, Jonas Mueller, Mayank Kumar, Jane-Ling Wang, Jing Lei
TL;DR
在数据中加入噪声,可以使用任何回归器模型来判断哪些数据值是错误的,该方法可以在数据集中区分真正的异常和自然数据波动,并且可以比传统方法更好地诊断真实的数据集。
Abstract
noise
plagues many numerical datasets, where the recorded values in the
data
may fail to match the true underlying values due to reasons including: erroneous sensors,
→