生成式揭穿气候误导
介绍了 CLIMATE-FEVER 数据集,旨在促进和鼓励改进为气候特定声明检索证据支持的算法,应对语言理解挑战,并帮助减轻虚假信息对气候变化的影响。
Dec, 2020
本研究提出了逻辑谬误检测任务,并提供一个包含逻辑谬误的数据集Logic及其子集LogicClimate,希望能通过一个理解论据基础逻辑结构的新型分类器来解决传统大型语言模型效果较差的问题,该任务可作为语言模型的新型推理挑战,并在打击错误信息传播方面发挥重要作用。
Feb, 2022
评估大型语言模型对气候变化主题的能力,从科学沟通原则出发,提供一个全面的评估框架,强调LLM生成结果的呈现和认识适当性,揭示LLM在气候传播领域的潜力和局限性。
Oct, 2023
大型语言模型 (LLMs) 在社会科学研究中通过模拟人类感知和行为的潜力展示了其算法忠实度的概念。本研究通过利用两项具有代表性的全国性气候变化调查评估了LLMs的算法忠实度和偏差,并发现LLMs能够有效捕捉总统投票行为,但在表示全球变暖观点时遇到挑战,尤其是在没有相关协变量的情况下。GPT-4在基于人口统计和协变量的条件下表现出更好的性能,然而,在LLMs对特定群体的观点估计中存在差异,尤其是在低估黑人对全球变暖的担忧方面。尽管强调了LLMs在社会科学研究中的潜力,但这些结果强调了在使用LLMs进行调查模拟时,进行细致的条件设置、模型选择、调查问卷格式和偏差评估的重要性。进一步研究提示工程和算法审计对于利用LLMs的潜力以及解决其固有限制至关重要。
Nov, 2023
通过介绍ClimateX数据集,使用最新的IPCC报告收集的8094个气候陈述和与之相关的置信水平,我们展示了最近的大型语言模型(LLMs)可以在气候相关陈述中对人类专家的置信度进行分类,尤其是在少样本学习环境中,但准确率有限(最多为47%)。在整体上,模型对低和中置信度陈述表现出一致且显著的过度自信。我们强调了这些结果对气候交流、LLMs评估策略以及在信息检索系统中使用LLMs的影响。
Nov, 2023
本文介绍了一个名为Climinator的新型基于人工智能的工具,用于自动化检验气候变化论断。Climinator利用来自IPCC报告和同行评审的科学文献等权威来源的多个大型语言模型,采用创新的调解者-拥护者框架,有效综合不同的科学观点,得出坚实、以证据为基础的评估结果。研究结果表明,在从Climate Feedback和Skeptical Science收集的论断测试中,我们的模型表现出了非凡的准确性。值得注意的是,将气候科学否认观点的拥护者纳入我们的框架中,Climinator的循环辩论过程可靠地趋于科学共识,突显了其将多样化观点整合为基于科学的事实结论的能力。尽管我们的研究存在一定限制并需要仔细解释,但我们的方法具有重要的潜力。我们希望激发更多的研究,并鼓励在其他领域,包括政治事实检验和法律领域,探索其适用性。
Jan, 2024
应对气候变化的自动化检测引发了关于气候变化的错误信息传播以及对社会福利构成了重大威胁的紧迫需求,本研究通过开发了一个两步骤的层次模型——增强CARDS模型,专门用于检测推特上的气候异议观点,然后将其应用于2022年的六个月内的五百万条气候主题推文,并发现推特上超过一半的气候异议观点涉及对气候行动者的攻击或阴谋论,气候异议行为的激增与政治事件、自然事件、异议观点传播者或信奉者之一的出现同时发生,在自动化应对气候错误信息方面的意义也得到了讨论。
Apr, 2024
气候变化的错误信息是一个复杂的社会问题,在技术和心理学交叉领域需要综合性、跨学科的解决方案, 本研究提出了一种“技术认知”方法,将心理学和计算机科学研究综合起来,通过解构气候变化的错误信息进行分类,培训模型以检测这些错误信息中的谬误。
May, 2024
气候变化的误导信息是解决人类面临的最严重威胁之一的关键障碍,本文研究了大型语言模型在气候信息方面的事实准确性。通过使用真假标记的问答数据对语言模型进行微调和评估,比较了开源模型,并评估它们对气候变化问题生成真实回答的能力。我们还研究了故意注入虚假气候信息的模型的可检测性,并发现这种注入可能不会影响模型在其他领域中的回答准确性。此外,我们比较了取消学习算法、微调和检索增强生成(RAG)在事实上对语言模型在气候变化主题上的基础的有效性。我们的评估揭示了取消学习算法对于微妙的概念性主张可能是有效的,尽管之前的研究发现它们在隐私情境下无效。这些见解旨在指导更具事实可靠性的语言模型的发展,并强调了保护语言模型免受误导攻击的额外工作的必要性。
May, 2024
本研究针对在线气候变化讨论中伪善指控检测这一被忽视的问题,独立定义了伪善指控检测,并识别出不同相关亚型。通过构建气候伪善指控语料库(CHAC)并使用少量示例学习方法,研究发现,GPT-4o和Llama-3模型在检测伪善指控方面表现出良好的潜力,F1值达到0.68,显著高于以往的0.44,表明该研究为在线气候辩论中的伪善指控大规模分析提供了新的视角和基础。
Sep, 2024