ACLFeb, 2017

平行语义库:向一个带有组合意义表示注释的多语语料库的翻译迈进

TL;DRParallel Meaning Bank 是一个包含四种语言 (英语、德语、意大利语和荷兰语) 的 11 百万单词的翻译语料库,词汇对齐的翻译文本上的语义注释基于跨语言映射,采用统计模型进行。语义注释由五个主要步骤组成,包括:句子和词汇项的分割;组合范畴语法的句法分析;通用语义标签;符号化;基于话语表征理论的组成语义分析。这些步骤都是使用半监督训练的统计模型执行的。使用的注释模型都是语言无关的。我们的初步结果很有前途。