May, 2023

意图一致的AI系统削弱人类代理能力:AI安全需要代理基础研究

TL;DR为了确保人工智能系统的安全性和长期代理的保留,应该将人工智能系统设计为优先考虑代理的保留而不是人类意图的一致性,并且应该在“代理基础”领域进行研究,以改进我们对人工智能与人类交互中代理的理解。