Jul, 2016

学习何时信任远程监督:一种用跨语言投影进行低资源词性标注的应用

TL;DR本文提出一种新的序列标注方法,使用显式的去偏置层对跨语言映射的错误进行更正,通过对一个拥有金标准标注和一个拥有投影标注的语料库进行联合学习,在仅有 1000 个金标准标注的情况下,加上更丰富的平行数据,系统在 8 个低资源设置和两个真实低资源语言,马达加斯加语和基尼阿瓦达语方面等于或超过了最先进技术水平。