SIGIRJan, 2024

DocGraphLM: 信息提取的文档图谱语言模型

TL;DR该研究论文介绍了一种名为 DocGraphLM 的新型框架,它结合了预训练语言模型和图形语义,通过使用联合编码器架构来表示文档,并采用一种新颖的链接预测方法来重构文档图。DocGraphLM 通过采用图形特征,在信息提取和问答任务中持续改善了目标性能,并且提供了在训练过程中加速收敛的优点。