EMNLPJan, 2023

弱监督标题依赖关系分析

TL;DR通过提供第一个标记有语法依存树的通用语言标题新闻语料库,我们旨在弥补语言处理句法分析领域对新闻标题的关注不足。通过从未标记的新闻标题 - 文章引文对中获取银标签训练数据来改进英语新闻标题的分析准确性,我们发现训练基于银标题解析的模型比仅基于黄金注释长格式文本训练的模型性能有显着提高。最终,我们发现尽管投影的银标签训练数据可以提高解析器在不同新闻媒体上的性能,但是该提高是受特定出版物特有结构的调节的。