Mar, 2024

用聚类定义丰富词语使用图

TL;DR我们提供了一个词语使用图(WUGs)数据集,其中现有的多种语言的WUGs通过作为语义定义的聚类标签丰富起来。通过微调编码-解码语言模型从头生成这些WUGs。进行的人工评估显示,与两个基准系统从WordNet选择的定义相比,这些定义更好地匹配WUGs中的现有聚类。同时,该方法易于使用,并且可以轻松扩展到新的语言。由此产生的丰富数据集对于进行可解释的语义变化建模非常有帮助。