Sep, 2023

HPSG 超标记再审视

TL;DR我们提出了基于 HPSG 的新型超标注模型,通过 SVM 和神经网络方法在高质量标注的树库上进行训练,与基线相比,SVM 和神经超标注模型都取得了明显更高的准确性。我们的 BERT 超标注模型在 WSJ23 数据集和 Cathedral and the Bazaar 数据集上分别达到了 97.26% 和 93.88% 的准确率。因此,将这些新型超标注模型整合到现代 HPSG 解析器中是有意义的,并且希望我们在这里使用的多样而困难的数据集能在该领域中获得更多的关注。我们还提供了完整的数据集,格式化用于标记分类。