Feb, 2023

自主智能体的价值工程

TL;DR本文提出了一种基于道德和社会心理学的新型人工道德代理范式,在其中将价值观灌输给代理以实现因环境而异的、与其他道德代理互动的目标,从而引导代理与人类的价值观保持一致。