TL;DR该研究通过自动计算句法分析树上的分布式含义表示来进行话语关系预测,包括实体提及之间的链接,并在预测 Penn 话语树库中的隐式话语关系时实现了显著改进。
Abstract
discourse relations bind smaller linguistic units into coherent texts.
However, automatically identifying discourse relations is difficult, because it
requires understanding the semantics of the linked arguments.
本文提出了一种计算分布式含义表示的方法来解决自动识别篇章关系的难题。我们通过结合句子的句法解析树,并使用一种新颖的向下组成算法,计算实体提及的含义表示。这种方法不仅可以预测句子间的篇章关系,还可以预测它们的指代实体提及之间的关系,并在 Penn Discourse Treebank 上取得了优越的表现。
本文研究了词表示应该包含分布式和关系语义这一假设。为此,我们使用 Alternating Direction Method of Multipliers (ADMM),它可以灵活地在原始文本上优化分布式目标和 WordNet 上的关系目标。初步结果表明,在一些情况下,在两种目标上训练的词表示可以改进知识库完成、类比测试和解析等方面。