May, 2018

联合国平行语料库注释翻译方向

TL;DR本研究将 UN 协议语料库中的翻译和原始文本区分开来,通过将问题建模为分类问题,可以达到高达 95%的分类准确性。我们通过为不同语言对派生并注释翻译方向的平行语料库,然后使用各种特征提取方法对数据进行分类。我们比较了不同的方法以及在不同语言中区分翻译和原始文本的能力。注释的语料库是公开可用的。