用于数据高效文本分类的潜变量生成模型

EMNLPOct, 2019

用于数据高效文本分类的潜变量生成模型

Latent-Variable Generative Models for Data-Efficient Text Classification

Xiaoan Ding, Kevin Gimpel

TL;DR通过向生成式文本分类器引入离散潜变量，并探究几种图模型配置，我们提高了它的性能，尤其在小数据集下，同时分析了模型的可解释性。

Abstract

generative classifiers offer potential advantages over their discriminative counterparts, namely in the areas of data efficiency, robustness to data shift and adversarial examples, and zero-shot learning (Ng and Jordan,2002; Yogatama et al., 2017; Lewis and Fan,2019). In this paper, we

generative classifiers discrete latent variables graphical model configurations text classification small-data settings

发现论文，激发创造

语言作为潜变量：离散生成模型用于句子压缩

通过深度生成模型进行文本压缩，利用离散语言模型分布作为文档的潜在表示，生成模型引入离散语言模型的概念，通过变分自编码器进行推断，本研究在大量监督数据训练的情况下，得出抽象和提取式压缩的最新成果，并探索半监督压缩场景。

Sep, 2016

文本生成的深度潜在变量模型

使用深度潜变量模型进行文本生成可以提高标准编码器 - 解码器模型的效果，同时保持深度神经网络的表达能力。

Mar, 2022

用于低资源文本分类的离散潜在变量表示

本文探讨深层潜变量模型的离散潜变量模型，比较不同方法在处理复杂问题时表现的优劣，并在低资源文档和句子分类中展示了更好的结果，其中使用的 Hard EM 极具优势。

Jun, 2020

神经变分文本处理的分段潜变量

本文提出一种新的分段常数分布作为一种复杂的潜在因素分布，以更好地建模实际数据集中的多模式潜在因素，实验结果表明，我们的方法在自然语言处理任务中实现了显著的提高。

Dec, 2016

文本处理的神经变分推断

通过引入一个通用变分推断框架来构建生成式和条件文本模型的变分推断网络，我们验证了该框架在生成式文档建模和监督式问题回答两个不同的文本建模应用中的有效性。

Nov, 2015

条件变分自编码器用于神经机器翻译

探讨使用潜变量模型实现神经机器翻译中的条件文本生成性能，通过引入连续潜变量来增强编码器 - 解码器 NMT 范例，利用 Inference Network 中的共同关注机制来扩展该模型，使用不同方法试图缓解后验崩溃问题，并且探究学习潜空间的能力，该模型能有效地优化翻译模型。

Dec, 2018

自然语言深度潜变量模型教程

通过变分推断的视角深入探讨了深度潜变量模型的局限性，洞察了深度参数化条件概率的困难性以及潜变量目标在反向传播中的不可微性问题。

Dec, 2018

离散变分自编码器在自然语言生成因素分离中的应用

本文提出一种基于变分自编码器（Variational Autoencoder）的新方法来实现对自然语言处理（NLP）系统的解释，并将文本语言特征建模为离散变量以实现学习解缠编码表示，实验结果显示该方法在多个基准测试和一个文本风格迁移后处理应用中表现优异且优于基于连续和离散变量的基准模型。

Sep, 2021

通过连续变异因素控制生成模型

本文提出了一种新的方法，通过找到生成模型中有意义的方向来提高生成模型潜在空间的可解释性，从而精确地控制生成图像的特定属性，如位置或比例。该方法对于搜索编码生成图像的简单变换方向（如平移，缩放或颜色变化）特别适用，并在 GAN 和变分自动编码器模型的质量和量化方面得到了证明。

Jan, 2020

通过主题感知离散潜变量学习语义文本相似度

本文提出了一种基于主题的离散潜变量模型，通过向量量化学习句子对表示的共享潜空间，进一步将量化表示注入基于语义驱动的注意力机制变压器语言模型，以提高语义相似性的性能。

Nov, 2022