Jun, 2024

基于大型语言模型的ESG指标表格的通用信息提取

TL;DR通过将表格转化为语句,我们提出了一种新颖的无特定领域数据结构,用于提取定量事实和相关信息,通过研究基于 T5 的语句提取模型,我们的最佳模型与基准模型相比,生成的语句与实际数据相似度达到了 82%,通过将模型应用于 ESG 报告中的超过 2700 个表格,我们展示了语句的优势,允许对大量 ESG 报告中的丰富信息进行探索性数据分析。