SIGIRJun, 2021

专利领域的基于语言学知识的掩码表示学习

TL;DR该研究提出了一种基于语言学启发的遮蔽方法,称为 LIM,该方法可用于域适应的预训练模型,以便在专利语言领域提供更好的表示。通过在两个不同的语言模型上评估专利语言的领域适应表示的性能,以专利 IPC 分类和相似性匹配作为后续任务,该研究证明了该方法的改进效果,并公开了源代码和域适应预训练专利语言模型。