Jul, 2016

高效文本分类的诀窍

TL;DR本文介绍了一种用于文本分类的简单高效的基线方法 fastText,在准确性方面通常与深度学习分类器相媲美,但在训练和评估方面快了数个数量级。我们用标准的多核 CPU 可以在不到十分钟的时间内对十亿多个单词进行训练,并在不到一分钟的时间内对 312K 种类别的 50 万个句子进行分类。