ACLMay, 2017

学习主题敏感词表示

TL;DR该论文提出使用分层狄利克雷过程学习每个单词的多个主题敏感表示的两种方法,通过模拟主题并集成每个文档的主题分布,可以得到能够区分给定单词不同含义的表示。该模型在词汇替换任务中表现出统计学显著的改进,表明常用的单词表示即使与上下文信息结合使用,也不足以完成该任务。