ACLFeb, 2019
文本分类需要多大的词汇量?一种基于变分的词汇选择方法
How Large a Vocabulary Does Text Classification Need? A Variational Approach to Vocabulary Selection
Wenhu Chen, Yu Su, Yilin Shen, Zhiyu Chen, Xifeng Yan...
TL;DR本论文提出了一种基于变分 dropout 的变分词汇 dropout(VVD)方法,用于智能地选择词汇子集以达到所需性能,通过在多个 NLP 分类任务上进行广泛实验证明了该方法在语料库选择问题上显著优于基于词频的和其他选择基准。