Aug, 2023

使用回答集编程对自主代理进行惩罚框架

TL;DR该论文提出了一个框架,用于对不遵守授权或义务政策的智能体进行处罚,在一个动态环境中进行推理。框架可以表示和推理与计划相关的处罚,并提出了一个算法,根据智能体在授权和义务政策方面的遵从程度来对其行为进行处罚。论文指出,除非有拯救人类生命等紧急目标,智能体可以根据最小总处罚选择计划。该框架可以惩罚不服从命令的智能体。