AAAIDec, 2018

利用跨语言次词相似性进行低资源文档分类

TL;DR该研究探讨了是否可以利用不同语言之间的字符级相似性实现跨语言文本分类,并提出了一个利用交叉语言字符级子词相似性的框架 (CACO),结合字符嵌入器和基于词的分类器。实验结果表明利用字符级别的知识转移比使用基于词的转移在相关语言间更有效。