ACLApr, 2018

介绍两个用于评估(不)相似性和相关度语义模型的越南语数据集

TL;DR我们提供了两个新颖的数据集 (ViCon 和 ViSim-400) 来评估越南语这种低资源语言的语义相似性模型,其中 ViCon 包括了各种词类中的同义词和反义词对,ViSim-400 则提供了人工评定的五种语义关系的相似程度,这两个数据集经过标准的共现和神经网络模型验证,显示出与相应英文数据集相媲美的结果。