BriefGPT.xyz
Jun, 2019
层次化文档编码器用于平行语料库挖掘
Hierarchical Document Encoder for Parallel Corpus Mining
HTML
PDF
Mandy Guo, Yinfei Yang, Keith Stevens, Daniel Cer, Heming Ge...
TL;DR
本研究利用多语言文本嵌入来对平行数据进行最近邻挖掘,通过三种不同的文本层级表示方法,发现用 HiDE 训练产生的文档嵌入结果表现最佳,达到了 UN 平行文档挖掘的最新成果。
Abstract
We explore using
multilingual document embeddings
for nearest neighbor mining of
parallel data
. Three
document-level representations
are i
→