ClimateBERT-NetZero:检测和评估净零排放和减排目标
我们提出了一种从国家法律和政策中提取气候目标的方法,并利用分类器可靠地识别三类目标(“净零”,“减排” 和 “其他”)的文本提及,并调查了模型的偏见和公平性影响,最后通过在全球国家气候法律和政策以及联合国气候变化框架公约提交文件的 Climate Policy Radar 数据集上运行分类器产生的数据集的特征,突出了自动化和可扩展的数据收集对于现有气候政策数据库和进一步研究的潜力,为决策者和研究人员提供了更易获取的重要气候政策要素。
Apr, 2024
本文运用最先进的 NLP 技术,对财务报告中的气候相关风险进行检测,通过调整 BERT 和 ClimateBert 两种 transformer 模型的 fine-tuning 过程,利用 Clima-Text 数据库,筛选出了 ClimateBert 在检测气候风险方面表现最佳,是投资者、机构代理人和公司监控财务报告中披露的气候风险的优秀工具。
Mar, 2023
本文提出了 Climate Change Benchmark(ClimaBench),这是一个用于系统评估 CC NLU 任务模型性能的基准收集现有不同数据集的基准。我们从公开可用的环境披露中筛选了两个大规模的标记文本分类和问答数据集,并提供了数据分析。
Jan, 2023
本文介绍了利用自然语言处理技术构建的问答型模型 ClimateQA,该模型可用于分析财务报告以确定与气候相关的内容,以应对气候变化对全球股市等投资领域的巨大影响。
Nov, 2020
本文研究了预训练语言模型在处理特定领域文本时的缺陷,提出了基于 transformer 的 CLIMATEBERT 语言模型,并证明其在气候相关文本处理任务中显著提升了模型效果。
Oct, 2021
本研究采用零样本文本分类技术,对公开认可 Task Force for Climate-related Financial Disclosures(TCFD)建议的银行报告中披露的气候相关信息进行了分析,发现 TCFD 建议推出后,企业对气候相关信息的披露呈现出明显增长趋势,但不同类型的信息披露程度存在显著差异,因此 TCFD 建议需要进一步完善。这些发现对气候相关信息披露框架的设计提供了重要启示。
Feb, 2023
该研究介绍了一种在绿色洗白风险方面使用生成标签来训练语言模型的新方法,并在可持续发展报告上进行了对比分析,最终的模型在准确率和 F1 得分上分别达到了 86.34% 和 0.67,展示了在这一任务中的有希望的研究方向。
Oct, 2023
使用基于 Transformer 的 DeBERTa 模型将分类问题转化为蕴含问题,使得排名最高的文档可以被视为正分类文档,从而缩短信息抽取过程中的阅读时间,并发现一定的召回率下,使用声明性形式的类别标签作为查询可以优于使用字典定义的类别标签。同时研究表明,随着主题范围的扩大,应阅读的文档百分比会增加。
Oct, 2022
本文提出了一种名为 ZeroBERTo 的新模型,利用无监督聚类方法在分类任务前获取压缩数据表示,其在长文本输入的性能和执行时间上都优于 XLM-R, F1 分数比 FolhaUOL 数据集上的 XLM-R 高约 12%。
Jan, 2022