ESG-FTSE: 一份具有 ESG 相关标签和用例的新闻文章语料库

May, 2024

ESG-FTSE: 一份具有 ESG 相关标签和用例的新闻文章语料库

ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases

Mariya Pavlova, Bernard Casey, Miaosen Wang

TL;DR我们创建了 ESG-FTSE 语料库，其中包含了带有 ESG 相关标注的新闻文章。我们开创了 ESG 标注方案，并进行了相关实验，证明该语料库可以用于准确的 ESG 预测。

Abstract

We present esg-ftse, the first corpus comprised of news articles with Environmental, Social and Governance (ESG) relevance annotations. In recent years, investors and regulators have pushed ESG investing to the mainstream due to the urgency of climate change. This has led to the rise o

esg-ftse corpus annotation esg labels annotation schema natural language processing

发现论文，激发创造

ESGBERT：一种用于帮助公司环境、社会和治理实践相关分类任务的语言模型

本文研究了基于自然语言处理技术对 ESG 文本进行分类的方法，通过对 BERT 模型进行细调，建立了一个 ESG 领域专用的预训练模型，并在环境类别的分类任务中取得了优于原 BERT 模型和基准模型的准确率。

Mar, 2022

应用社交网络分析和机器学习创建系统化的 ESG 评分体系以推动更可持续的公司运营实践

该研究论文通过使用社会情感考量，旨在创建一个数据驱动的 ESG 评估体系，该体系可以通过提供更加平衡的观点和更系统化的评分来为公司提供更好的指导，从而帮助公司创建更具针对性和有影响力的倡议。使用基于 Python 的网络爬虫从维基百科、推特、领英和谷歌新闻中收集数据，然后通过自然语言处理算法对 ESG 子类别进行情感评分。然后使用这些特征，训练和校准机器学习算法以测试其预测能力，其中最强大的模型是随机森林模型，其平均绝对误差为 13.4％，相关性为 26.1％（p 值为 0.0372），显示出令人鼓舞的结果。总的来说，跨子类别测量 ESG 社会情感可以帮助高管将努力集中在人们最关注的领域。此外，这种数据驱动方法可以为没有覆盖范围的公司提供评级，从而使更多具有社会责任感的公司得以发展。

Sep, 2023

使用上下文句子分析模型识别 ESG 概念

Trading Central Labs 和 La Rochelle 大学的 L3i 实验室在 ESG 领域上的合作中，基于预训练的 BERT 和 RoBERTa 模型，提出了对 Fortia ESG 分类体系的新条目和 ESG 相关句子的分类方法。该方法在两个子任务中均取得了显著的性能提升，并跻身最佳系统之一。

Jul, 2022

基于生成式大语言模型的 ESG 问题识别框架

本文研究使用多种技术手段和模型，实现在英文和法语子任务中以高精度识别新闻文章中的 ESG 问题，并获得优异的表现。结果突显了应用先进的语言模型技术在获取跨语言 ESG 问题方面的潜力。

Jun, 2023

ESG 情绪分析：人工与语言模型性能比较，包括 GPT

本研究通过比较人工与机器在 ESG 相关情感测量方面的表现，选取 150 条推特进行情感分类，并建立一个基准数据集用于评估不同机器方法（包括字典方法和多种语言模型方法）的性能。

Feb, 2024

ESG 评级预测的异构集成

通过使用前馈神经网络、CatBoost 和 XGBoost 集成成员的异构集成模型来预测 ESG 评级，基于基本数据既能够降低成本、提高可扩展性，也能够超越此领域的既往成果，解决可持续性相关问题。

Sep, 2021

金融年报特征提取的多任务学习

通过使用多任务学习方法，结合不同任务上的信息，我们提出了多种金融文本分类方法，重点关注金融情绪、客观性、前瞻性句子预测和 ESG 内容检测。然后，我们使用这些分类器从 FTSE350 公司的年度报告中提取文本特征，并研究 ESG 定量分数与这些特征之间的关联。

Apr, 2024

利用 BERT 语言模型进行多语言 ESG 问题识别

本研究利用 BERT 语言模型探索了多种策略，用于准确分类新闻文档至 35 个不同的 ESG 问题类别，结果显示 RoBERTa 分类器在英文测试数据集中位居第二，并在法语测试数据集中与其他模型并列第五，此外，我们针对中文设计的基于 SVM 的二元模型在测试数据集中展现了优异的性能，位居第二。

Sep, 2023

ESG 报告的高级非结构化数据处理：结构化转换和增强分析方法论

通过使用 “无结构核心库” 将 ESG 报告转化为结构化、可分析的格式，该研究引入了一种创新的方法，强调其处理不同数据类型（包括文本、图像和表格）的能力，从而实现对企业治理和可持续性分析中先进 NLP 技术和大型语言模型的应用。

Jan, 2024

通过 GPT-4 隐性规则学习进行的 ESG 分类

该研究探究了如何通过提示、思维链推理和动态上下文学习等策略，引导 GPT-4 等先进语言模型与未知的环境、社会和治理（ESG）评估准则保持一致，展示了语言模型在金融下游任务中的潜力和培训免费解决方案的机会。

Mar, 2024