Jun, 2023

运用反事实推论改善道德推理——思想实验

TL;DR本文提出了一种名为Thought Experiments的新提示框架,通过反事实让语言模型学习更好的道德推理。实验结果表明,使用这个提示框架可以消除Moral Scenarios任务的错误率,并且少量的人类监督可以显著提高任务的准确性。