Feb, 2023

无需对齐的安全

TL;DR本文提出了一种基于伦理理性和杂交定理证明器的人工智能安全性实现方法,通过将 AI 的伦理道德与其理性联系起来,可以具有长期优势并避免伦理道德偏差与对人类价值的偏差。