KDDMar, 2015

基于语义词嵌入的文本分割

TL;DR本研究探讨了在文本分割算法中应用语义单词嵌入的方法,包括 C99 分割算法和灵感来自分布式单词向量表示的新算法,并通过开发一个用于讨论一类分割目标的通用框架,研究了贪婪与精确优化方法的有效性,建议了一种新的迭代改进技术来提高贪婪策略的性能,将结果与已知基准进行比较并演示了我们的内容向量分割(CVS)在 Choi 测试集上的未经训练方法的最先进性能。最后,我们将分割过程应用于从 arXiv.org 数据库中提取的学术文献的野外数据集。