ESG-FTSE: 一份具有 ESG 相关标签和用例的新闻文章语料库
本文研究了基于自然语言处理技术对 ESG 文本进行分类的方法,通过对 BERT 模型进行细调,建立了一个 ESG 领域专用的预训练模型,并在环境类别的分类任务中取得了优于原 BERT 模型和基准模型的准确率。
Mar, 2022
该研究论文通过使用社会情感考量,旨在创建一个数据驱动的 ESG 评估体系,该体系可以通过提供更加平衡的观点和更系统化的评分来为公司提供更好的指导,从而帮助公司创建更具针对性和有影响力的倡议。使用基于 Python 的网络爬虫从维基百科、推特、领英和谷歌新闻中收集数据,然后通过自然语言处理算法对 ESG 子类别进行情感评分。然后使用这些特征,训练和校准机器学习算法以测试其预测能力,其中最强大的模型是随机森林模型,其平均绝对误差为 13.4%,相关性为 26.1%(p 值为 0.0372),显示出令人鼓舞的结果。总的来说,跨子类别测量 ESG 社会情感可以帮助高管将努力集中在人们最关注的领域。此外,这种数据驱动方法可以为没有覆盖范围的公司提供评级,从而使更多具有社会责任感的公司得以发展。
Sep, 2023
Trading Central Labs 和 La Rochelle 大学的 L3i 实验室在 ESG 领域上的合作中,基于预训练的 BERT 和 RoBERTa 模型,提出了对 Fortia ESG 分类体系的新条目和 ESG 相关句子的分类方法。该方法在两个子任务中均取得了显著的性能提升,并跻身最佳系统之一。
Jul, 2022
本文研究使用多种技术手段和模型,实现在英文和法语子任务中以高精度识别新闻文章中的 ESG 问题,并获得优异的表现。结果突显了应用先进的语言模型技术在获取跨语言 ESG 问题方面的潜力。
Jun, 2023
本研究通过比较人工与机器在 ESG 相关情感测量方面的表现,选取 150 条推特进行情感分类,并建立一个基准数据集用于评估不同机器方法(包括字典方法和多种语言模型方法)的性能。
Feb, 2024
通过使用前馈神经网络、CatBoost 和 XGBoost 集成成员的异构集成模型来预测 ESG 评级,基于基本数据既能够降低成本、提高可扩展性,也能够超越此领域的既往成果,解决可持续性相关问题。
Sep, 2021
通过使用多任务学习方法,结合不同任务上的信息,我们提出了多种金融文本分类方法,重点关注金融情绪、客观性、前瞻性句子预测和 ESG 内容检测。然后,我们使用这些分类器从 FTSE350 公司的年度报告中提取文本特征,并研究 ESG 定量分数与这些特征之间的关联。
Apr, 2024
本研究利用 BERT 语言模型探索了多种策略,用于准确分类新闻文档至 35 个不同的 ESG 问题类别,结果显示 RoBERTa 分类器在英文测试数据集中位居第二,并在法语测试数据集中与其他模型并列第五,此外,我们针对中文设计的基于 SVM 的二元模型在测试数据集中展现了优异的性能,位居第二。
Sep, 2023
通过使用 “无结构核心库” 将 ESG 报告转化为结构化、可分析的格式,该研究引入了一种创新的方法,强调其处理不同数据类型(包括文本、图像和表格)的能力,从而实现对企业治理和可持续性分析中先进 NLP 技术和大型语言模型的应用。
Jan, 2024
该研究探究了如何通过提示、思维链推理和动态上下文学习等策略,引导 GPT-4 等先进语言模型与未知的环境、社会和治理(ESG)评估准则保持一致,展示了语言模型在金融下游任务中的潜力和培训免费解决方案的机会。
Mar, 2024