Jun, 2024

语言模型对道德的理解?走向鲁棒的道德内容检测

TL;DR使用大规模语言模型和自然语言推理模型训练获得的抽象概念和常识知识,我们研发了多领域道德价值检测的多功能和强大方法,其中采用 GPT 3.5 模型作为基于零样本的无监督多标签道德价值分类器,消除了对标记数据的显式训练需求。与较小的基于自然语言推理的零样本模型相比,结果显示自然语言推理方法在性能上与 Davinci 模型不相上下。此外,我们对在不同领域训练监督模型以探索其在处理来自不同源的数据时的效果,并将其与无监督方法进行比较的性能进行了详细的调查分析。推广了一种无监督道德价值检测的最新零样本模型 Davinci,并与监督模型进行了比较评估,从而突破了道德价值检测的极限,无需显式训练标记数据,并揭示了各自的优势和劣势。