Oct, 2023

一个可扩展的框架用于从复杂的ESG年度报告中提取目录

TL;DR提出了一个新的表达层级结构的数据集ESGDoc,以及一种构建模型和修改过程(CMM)的表目抽取框架,该框架通过考虑文本块的上下文信息来独立建模每个表目节点,并在处理任意长度的文档时展示出较好的性能和可扩展性。