BriefGPT.xyz
Dec, 2023
学习人类化的表示以实现学习人类价值
Learning Human-like Representations to Enable Learning Human Values
HTML
PDF
Andrea Wynn, Ilia Sucholutsky, Thomas L. Griffiths
TL;DR
构建与人类价值和目标相一致的AI系统,防止造成伤害或违反社会可接受行为的标准是一个重要课题,本研究通过研究伦理学作为价值一方面并训练多个ML代理,研究其与人类的代表性一致程度与学习最具道德行为的性能之间的关系。
Abstract
How can we build
ai systems
that are aligned with
human values
and objectives in order to avoid causing harm or violating societal standards for acceptable behavior? Making
→