BriefGPT.xyz
Ask
alpha
关键词
data repair
搜索结果 - 3
OTClean: 条件独立性违反数据清洗的最优输运方法
我们介绍了一种利用最优输运理论进行条件独立性约束下数据修复的框架,并将该问题转化为正则化的优化问题,提出了一种受 Sinkhorn 算法启发的迭代算法来解决高维大规模数据的计算问题。通过广泛的实验,我们证明了该方法在实际数据清洗和预处理任务
→
PDF
4 months ago
变色龙:公平感知多模态数据增强的基础模型,提升少数族裔的覆盖率
我们提出了 Chameleon,这是一个系统,它有效地利用生成 AI 和基础模型,在最小程度上增加合成生成元组的数据集,以增强被少数群体所代表的覆盖范围,并通过数据修复显著降低了模型在下游任务中的不公平性。
PDF
5 months ago
混合类型数据的稳健变分自编码器用于异常检测和修复
本文提出了 Robust Variational Autoencoder (RVAE) 作为一个深度生成模型来解决表格数据中无监督的异常点检测和修复问题,RVAE 能够识别出异常的单元格并进行修复,该方法在混合的表格数据中的异常点检测和修复
→
PDF
5 years ago
Prev
Next