Feb, 2018

一夜建立梵文分词器

TL;DR提出了一种基于序列到序列模型的 Sanskrit Sandhi 文本分词方法,该模型只使用 Sandhi 化字符串作为输入,并预测正常分词的字符串,经过实验比当前最先进的模型具有更好的表现,且可在一晚上进行训练并应用于生产。