Aug, 2023

ESG 重点 DLT 研究的演变:文献的自然语言处理分析

TL;DR快速发展的分布式账本技术 (DLTs) 需要深入了解其各个组成部分,然而,目前尚缺乏一个着重于 DLT 的环境可持续性和治理 (ESG) 组成部分的系统文献综述。为弥补这一空白,我们选择了 107 篇种子论文,构建了一个由 63,083 个参考文献组成的引用网络,并将其精简为 24,539 篇出版物进行分析。然后,我们根据已建立的技术分类体系,用 12 个顶级类别对 46 篇论文中的命名实体进行了标记,并通过指出 DLT 的 ESG 元素来完善该分类体系。利用基于转换器的语言模型,我们对预训练语言模型进行微调,用于命名实体识别 (NER) 任务。我们使用微调后的语言模型从整个语料库中提炼出 505 篇关键论文,通过命名实体和时序图分析在 ESG 背景下的 DLT 演进进行文献综述。我们的贡献是一种用于在 DLT 领域进行机器学习驱动的系统文献综述的方法,在其中特别强调 ESG 方面。此外,我们还提供了一个专为 DLT 和 ESG 相关研究设计的首个命名实体识别数据集,其中包含 54,808 个命名实体。