大型文献计量数据库中 SDG 分类的执行性
本研究利用 82000 多篇澳大利亚大学的出版物作为案例研究,通过相似度度量与 OpenAI GPT 模型将这些出版物与可持续发展目标(SDGs)进行映射,结果显示采用相似度度量的模型能够补充 GPT 模型进行 SDG 分类,此外,深度学习方法在处理敏感数据方面更加可靠,并且无需使用商业人工智能服务或部署昂贵的计算资源来运行大型语言模型。研究表明,两种方法的结合可以实现可靠的研究到 SDGs 的映射结果。
Nov, 2023
本研究比较了不同文本源使用的多个基于文本的系统以监测联合国可持续发展目标,证明了这些系统在真阳性率和真阴性率方面存在显著差异,偏好某些可持续发展目标,且受到分析的文本类型和数量的影响。研究发现汇集多个标注系统的集成模型能改善这些限制,以优于所有现有系统的标注性能。自动化方法应结合集成方法作为推断联合国可持续发展目标研究工作的使用。
Jan, 2023
对大型语言模型(LLMs)的态度与联合国可持续发展目标(SDGs)之间的差异进行综合回顾和分析,发现其在理解、情感、文化差异、任务目标、决策过程中存在的差异,以及由于训练数据不足、历史偏见、质量问题、缺乏语境理解和倾斜的伦理价值所反映的风险和危害,提出战胜这些挑战的策略和建议,以确保 LLMs 与 SDGs 原则和目标的一致性,并创造一个更公正、包容和可持续发展的未来。
Apr, 2024
我们用一个名为 PaLM 2 的 LLM 来预测大学课程的联合国可持续发展目标(SDG),并使用它生成训练数据,基于一个嘈杂的人工撰写的课程描述作为输入。我们使用这些数据来训练几个不同的较小语言模型来预测大学课程的 SDGs。该研究有助于更好地使可持续发展目标在大学层面得到应用。在我们的实验中表现最佳的模型是 BART,其 F1 得分为 0.786。
Feb, 2024
该研究比较了一个专门编译的语言模型和通用模型(如 OpenAI 的 GPT-3.5)在检测文本数据中可持续发展目标(SDGs)方面的效果。通过对大型语言模型(LLMs)进行关键性回顾,探讨了与偏见和敏感性相关的挑战。强调了需要专门的训练来进行准确、无偏的分析。使用公司描述数据集的案例研究揭示了 GPT-3.5 和专门的 SDG 检测模型之间的差异。虽然 GPT-3.5 具有更广泛的覆盖范围,但可能针对公司活动的相关性有限地识别出 SDGs。相反,专门的模型更专注于高度相关的 SDGs。强调了深思熟虑的模型选择的重要性,考虑任务需求、成本、复杂性和透明度。尽管 LLMs 非常灵活,但建议在需要精确性和准确性的任务中使用专门的模型。研究最后鼓励进一步研究在 LLMs 的能力与领域特定专业知识和可解释性之间找到平衡。
Jul, 2023
大型语言模型中的社会偏见评估和缓解技术的综述,介绍了社会偏见与公平的概念、评估指标和数据集,以及介绍了干预方法的分类和研究趋势,帮助研究人员和实践者更好地理解和防止偏见在大型语言模型中的传播。
Sep, 2023
该研究介绍了 SustainBench,它涵盖了与经济发展、农业、健康、教育、水和卫生、气候行动以及陆地生活有关的 15 个基准任务,旨在通过提供标准基准来评估机器学习模型在各种可持续发展目标上的任务,在数据方面降低机器学习社区的参与门槛,并鼓励发展新的机器学习方法,以促进实现可持续发展目标的进展.
Nov, 2021
该研究介绍了利用开放源代码的地理定位维基百科文章中的文本信息,运用现代 NLP 技术,预测社区层面的资产财富和教育成果的新方法,提高普查数据收集的成本效益,优于先前的数据预测基准,能为社会科学研究和政策决策提供参考。
May, 2019