SIGIRJan, 2024
DocGraphLM: 信息提取的文档图谱语言模型
DocGraphLM: Documental Graph Language Model for Information Extraction
Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah
TL;DR该研究论文介绍了一种名为 DocGraphLM 的新型框架,它结合了预训练语言模型和图形语义,通过使用联合编码器架构来表示文档,并采用一种新颖的链接预测方法来重构文档图。DocGraphLM 通过采用图形特征,在信息提取和问答任务中持续改善了目标性能,并且提供了在训练过程中加速收敛的优点。