Jun, 2019

层次化文档编码器用于平行语料库挖掘

TL;DR本研究利用多语言文本嵌入来对平行数据进行最近邻挖掘,通过三种不同的文本层级表示方法,发现用 HiDE 训练产生的文档嵌入结果表现最佳,达到了 UN 平行文档挖掘的最新成果。