Mar, 2023

利用负采样改进上下文化主题模型

TL;DR本文提出了一种基于负采样机制的上下文主题模型,通过扰动生成的文档 - 主题向量,并利用三元组损失函数,鼓励从正确文档 - 主题向量重构出来的文档与输入文档相似,与从扰动向量重构出来的文档相异,实验证明该方法在不同主题数量公开数据集上得到了改善。同时该模型具有较高的主题多样性。