多领域道德学习数据融合框架
通过精心设计的 MoralBERT 模型,结合社交媒体平台的标注道德数据,探索了道德预测及领域适应技术在理解有争议的社会议题上的应用,结果表明在领域内的预测模型明显优于传统模型,但领域外的泛化仍需进一步探索。
Mar, 2024
使用大规模语言模型和自然语言推理模型训练获得的抽象概念和常识知识,我们研发了多领域道德价值检测的多功能和强大方法,其中采用 GPT 3.5 模型作为基于零样本的无监督多标签道德价值分类器,消除了对标记数据的显式训练需求。与较小的基于自然语言推理的零样本模型相比,结果显示自然语言推理方法在性能上与 Davinci 模型不相上下。此外,我们对在不同领域训练监督模型以探索其在处理来自不同源的数据时的效果,并将其与无监督方法进行比较的性能进行了详细的调查分析。推广了一种无监督道德价值检测的最新零样本模型 Davinci,并与监督模型进行了比较评估,从而突破了道德价值检测的极限,无需显式训练标记数据,并揭示了各自的优势和劣势。
Jun, 2024
本研究旨在研究道德价值观和语言使用在社交媒体文本中的领域移位,检验其对道德分类任务的影响,并提出了一种神经适应框架。通过实例加权来提高跨领域分类任务的性能,研究结果表明,在 7 个社会运动中,微调后的任务获得高达 12.1%的性能改善,而使用 COVID-19 疫苗作为例子的细化研究得到了 5.26%的性能提升。
Apr, 2022
本文介绍了 ETHICS 数据集,旨在通过连接社会世界知识和价值判断来评估语言模型对道德基本概念的了解程度,研究发现当前语言模型有望但能力不完整地预测基本人类道德判断,并提供了实现人工智能与人类价值对齐的一步。
Aug, 2020
研究了消除数据集偏见的方法,并提出了一个能更好地在域内和域外数据集上提高性能的通用框架,可用于问答任务,并与现有的消除数据集偏见的方法进行了比较。
Oct, 2020
我们提出了基于文本的框架,通过纵向语料库研究公众道德情感变化。我们的方法建立在语言使用可以反映人们对对与错的道德观念之上,并通过探索从时间序列的词嵌入中学习到的道德偏见来构建我们的方法论。我们的研究为应用自然语言处理技术对社会中的道德情感变化进行表征提供了机会。
Jan, 2020
本文提出了一个旨在增强原始数据集数据质量的框架,并应用于四个生物医学数据集,使用回译技术提高数据集质量,在 BioASQ 数据集上表现出相对提高了 33%/40% 的检索 / 阅读器模型的微调效果。
Apr, 2023
本文提出了一个关于面部和医学图像的基准测试,并介绍了一个新的谐波公平(HF) 得分来综合地评估每个模型在准确性和公正性方面与参考基线相比的情况。实验结果发现,CD 方法比最先进的公平算法更能有效地解决模型公理问题。综上所述,我们的工作为计算机视觉中的公平性问题提供了更系统的分析方法。
Mar, 2023