ICLRMar, 2022

用主题嵌入混合表示单词嵌入混合

TL;DR本文提出了一种新的主题建模框架,在该框架中,每个文档都被视为一组单词嵌入向量,每个主题都被建模为嵌入空间中的嵌入向量,并在相同的向量空间中嵌入单词和主题,定义一种方法来衡量文档单词的嵌入向量与主题嵌入向量之间的语义差异,并优化主题嵌入以最小化所有文档的期望差异。实验结果表明,所提出的方法在发现更连贯和多样化的主题以及提取更好的文档表示方面具有竞争性的性能。