BriefGPT.xyz
Mar, 2012
基于贝叶斯方法的冲突数据源真相发现数据整合
A Bayesian Approach to Discovering Truth from Conflicting Sources for Data Integration
HTML
PDF
Bo Zhao, Benjamin I. P. Rubinstein, Jim Gemmell, Jiawei Han
TL;DR
本研究提出了一个基于概率图模型的方法,可以自动推断真实记录和数据源质量,为解决数据集成中存在的真实性问题提供了一种新的方法。在两个真实世界的数据集上进行实验,我们的方法在真实性问题方面优于现有的最先进方法。
Abstract
In practical
data integration
systems, it is common for the data sources being integrated to provide conflicting information about the same entity. Consequently, a major challenge for
data integration
is to deriv
→