带有经验先验的实体解析

Sep, 2014

Entity Resolution with Empirically Motivated Priors

Rebecca C. Steorts

TL;DR本文提出了一种基于经验贝叶斯原则的记录链接方法，该方法使用数据的经验分布函数作为潜在实体的先验，同时允许分类和字符串值变量，包括一种新的概率机制，可以使观察记录值与其关联的潜在实体的值偏离。作者将该方法应用于一个德国名字的模拟数据集和一个意大利家庭调查，并表明该方法执行良好。

Abstract

Databases often contain corrupted, degraded, and noisy data with duplicate entries across and within each database. Such problems arise in citations, medical databases, genetics, human rights databases, and a variety of other applied settings. The target of statistical inference can be viewed as an unsupervised problem of determining the edges of a bipartite

record linkage empirical bayesian latent entities string-valued variables categorical fields

发现论文，激发创造

(几乎) 所有实体解析

文章综述了记录链接、实体解析、概率论、聚类和规范化等领域的历史发展、目前应用和未来研究方向。

Aug, 2020

贝叶斯元先学习：基于经验贝叶斯的方法

本文提出了一种层次经验贝叶斯方法，以解决实际问题中面临的挑战，即缺乏信息先验和无法控制参数学习速率的问题。该方法从数据本身学习经验元先验，并将它们用于解耦 GLM 中的一阶和二阶特征的学习速率。作者将其应用于标准监督学习优化问题以及在线组合优化问题中，在实验中表现出了显著的改进。

Feb, 2020

关系蕴含的概率模型

通过构建一个概率模型，该论文提出了一种新的关系推导框架，提高了在相关数据集上的推导分数；此外，该论文还提供了两个用于帮助未来研究的实用资源：一种改进的判定数据集框架和一个包含 17848 个标记实例的公共数据集，其标记的精度从 53％提高到了 95％。

Jul, 2019

基于贝叶斯方法的冲突数据源真相发现数据整合

本研究提出了一个基于概率图模型的方法，可以自动推断真实记录和数据源质量，为解决数据集成中存在的真实性问题提供了一种新的方法。在两个真实世界的数据集上进行实验，我们的方法在真实性问题方面优于现有的最先进方法。

Mar, 2012

基于聚类的生物医学实体链接推导

该研究提出了一种基于聚类的推理模型，可以在生物医药领域的文本中实现实体链接，将多个提及归为一组，有望提高独立预测精度。

Oct, 2020

使用广义变分推断的动态贝叶斯网络的经验贝叶斯

通过经验贝叶斯方法学习动态贝叶斯网络的研究，使用数据驱动的先验获得模型以量化不确定性，结合广义变分推断的最新发展，表明了对 DAG 结构和参数后验的不确定性的采样的潜力。

Jun, 2024

关于具有潜在根变量的贝叶斯网络的注记

贝叶斯网络中的隐变量作为根节点计算的似然函数特征化，在剩余的显变量上的边缘分布也被命名为经验贝叶斯网络。通过显变量的观测数据集，我们可以量化经验贝叶斯网络的参数。我们证明，（i）从原始贝叶斯网络的这样一个数据集的似然性被经验贝叶斯网络的似然性的全局最大值所主导；（ii）只有当贝叶斯网络的参数与经验模型的参数一致时，才能达到这样的最大值。

Feb, 2024

关系数据的判别性概率模型

本文提出一种基于 (条件) 马尔科夫网络的框架，可以 effectively 地训练 probabilistic relational models，并使用近似概率推断对多个相关对象进行 collective classification，从而解决了先前方法的两个限制：有向模型无法表示许多重要的关系依赖性和难以用于判别式训练。在网页分类任务上的实验证明，建模关系依赖性可以显著提高分类准确性。

Dec, 2012

统一逻辑蕴涵和统计估计

本文基于生成模型的思想，采用 Bayesian learning 方法，探究形式逻辑及其数理统计特性，构建了一个统一的形式逻辑和统计推理理论。

Feb, 2022

变量选择问题中的贝叶斯和经验贝叶斯多重性调整

本文研究标准 Bayesian 变量选择先验在线性回归中的多重校正效应，澄清了 Bayesian 方法中的多重校正及 Ockham's-razor 的区别，同时通过实例、理论和模拟对比了经验 Bayes 和全 Bayes 方法。

Nov, 2010