Sep, 2022

边缘位移瓦瑟斯坦距离对 UD 解析性能的影响

TL;DR本文通过介绍一种测量方法,评估训练数据和测试数据中边缘偏移(边缘的有向距离)分布的差异,为自然语言处理中的解析性能问题做出贡献。通过使用多种统计方法,我们建立了这种测量与解析性能之间的统计相关性,即使控制潜在的协变量。然后,我们利用此结果建立了一种采样技术,提供了给定树库的解析系统的下限和上限,并证明了该方法作为一种基于相关性的探索性工作的参考。