Mar, 2023
利用负采样改进上下文化主题模型
Improving Contextualized Topic Models with Negative Sampling
Suman Adhya, Avishek Lahiri, Debarshi Kumar Sanyal, Partha Pratim Das
TL;DR本文提出了一种基于负采样机制的上下文主题模型,通过扰动生成的文档 - 主题向量,并利用三元组损失函数,鼓励从正确文档 - 主题向量重构出来的文档与输入文档相似,与从扰动向量重构出来的文档相异,实验证明该方法在不同主题数量公开数据集上得到了改善。同时该模型具有较高的主题多样性。