Oct, 2024

通过最大化语义信息提高无监督成分解析

TL;DR本文解决了无监督成分解析中传统目标函数未能充分考虑构成结构与语义之间密切关系的问题。我们提出了一种新目标,通过最大化构成结构与句子语义之间的信息量来训练无监督解析器,并开发了基于树条件随机场的模型。实验结果表明,该方法在四种语言中的五种PCFG变体上平均提高了7.85个百分点,展现出极大的潜力。