Apr, 2017

探索词嵌入技术在无监督文本用户生成内容归一化中的应用

TL;DR提出了一种基于词的分布式表示(或词嵌入)的独立于语言和领域,完全无监督并可扩展的方法,用于从单词嵌入中学习规范化词典,以修正巴西葡萄牙语产品评论中的拼写错误和互联网俚语,相比当前可用的工具表现更好。