Feb, 2024

标点恢复提升结构理解无需监督

TL;DR非监督学习目标如语言建模和去噪在产生预训练模型方面扮演重要角色,然而,最近的大语言模型的对话能力令人印象深刻,但它们在捕捉文本内的句法或语义结构方面滞后。我们假设这种语言性能和机器能力之间的差异是由于目前流行的预训练目标对语言结构知识的转移不足引起的。我们表明,标点恢复可以提高与结构相关的任务的内、外分布性能,如命名实体识别、开放信息提取、块划分和词性标注。标点恢复是一种有效的学习目标,可以改善结构理解并产生更健壮的结构感知的自然语言表示。