使用数据增强的改进贝叶斯逻辑回归监督主题模型

ACLOct, 2013

使用数据增强的改进贝叶斯逻辑回归监督主题模型

Improved Bayesian Logistic Supervised Topic Models with Data Augmentation

Jun Zhu, Xun Zheng, Bo Zhang

TL;DR本文介绍使用正则化常量和 Gibbs 采样算法的辅助泊松 - 伽马变量，增强 PF 主题模型的性能。实证结果表明，该算法可以显著提高预测性能和时间效率

Abstract

supervised topic models with a logistic likelihood have two issues that potentially limit their practical use: 1) response variables are usually over-weighted by document word counts; and 2) existing variational

supervised topic models logistic likelihood regularization constant gibbs sampling algorithm bayesian inference

发现论文，激发创造

具有数据增强的 Gibbs 最大裕度主题模型

本文提出了 Gibbs max-margin 监督主题模型的新型损失函数，通过引入增广变量和解析地消除 Dirichlet 变量，从而开发了简单的 Gibbs 抽样算法以解决多个潜在 SVM 子问题，且无需限制假设和解决 SVM 子问题，从而在许多分类任务中实现了时间效率和分类性能的显着提高。

Oct, 2013

使用 Polya-Gamma 潜变量进行逻辑回归模型的贝叶斯推断

本文提出了一种新的数据增强策略，基于多项式 Gamma 分布，用于贝叶斯模型中的后验推断。经过实验证明，该方法在回归模型中表现优异，且具有简单、高效等优点。

May, 2012

在扩展限制下学习主题模型和潜在贝叶斯网络

本文提出了一个基于二阶可观测矩的无监督估计潜变量模型的方法，包括概率主题模型和潜线性贝叶斯网络等广泛的模型，且不需要对潜变量的分布做出任何假设，可以处理主题或潜因子之间的任意相关性，并且提出了一个可行的学习方法通过 L1 优化在数值实验中进行了研究。

Sep, 2012

基于众包的监督主题模型用于分类与回归学习

本文提出了两种基于监督学习的主题模型，分别用于分类和回归，能够考虑到实践中在不同的标注者之间遇到的多样性和偏见。同时，我们还开发了一种有效的随机变分推断算法，能够适应非常大的数据集，并在实验中证明了该模型相对于现有技术的优越性。

Aug, 2018

依赖多项式模型简易实现：利用 Pólya-Gamma 扩充的棍子分割方法

使用逻辑棒式分解法和泊松 - 伽马增强技术对多项分布进行重新定义，提出具有联合高斯似然的潜在变量，从而利用广泛的高斯模型贝叶斯推断技术，实现对具有相关性的离散数据的建模。

Jun, 2015

逻辑变分贝叶斯重新讨论

本文提出了一种新的边界方法用于估计软加函数期望，并展示了它如何应用于变分逻辑回归和高斯过程分类。与其他边界方法不同，我们的方法不需要扩展变分族或引入额外的参数来确保边界的紧致性。实验证明，这个边界方法比现有方法更紧致，而且计算速度显著更快，从而获得了最先进的变分后验性能。

Jun, 2024

潜在狄利克雷分配的稀疏随机推断

本文提出了一种混合算法，将稀疏 Gibbs 采样的效率与在线随机推断的可扩展性相结合，用于分析包含 120 万本书（330 亿词）的语料库，在多个 Bayesian 隐变量模型中具有广泛的推广能力。

Jun, 2012

多分类高斯过程分类变共轭：通过数据增强实现高效推断

本文提出了一种基于改进的 softmax 似然函数的新的可扩展的多类高斯过程分类方法，该新似然函数具有两个好处：它可以导致良好校准的不确定性估计，并允许有效的潜变量扩充。该模型通过块坐标升高更新实现了快速的变分推断方法，具有快速的条件共轭性，既可以实现不确定性校准，又可以实现速度。我们的实验表明，与现有技术相比，我们的方法在具有良好校准的不确定性估计和具有竞争预测性能的情况下，可以快两个数量级。

May, 2019

Dirichlet - 多项式回归条件下的任意特征主题模型

本文提出一种基于 DMR 主题模型的 log-linear 先验方法，以元数据特征为参数，以模拟文档中词汇的分布和主题的分布。实验结果表明 DMR 主题模型可以超越以往的主题模型，从而提高了对文档元数据的建模能力。

Jun, 2012

监督式主题模型

介绍了一种新的统计模型 —— 监督潜在狄利克雷分配（SLDA），应用变分方法处理难以计算的后验期望，解决回答类型的多样性并预测新文档的回答数值。与现代正则化回归以及无监督 LDA 分析相比，SLDA 有显著优势。

Mar, 2010