TL;DR本研究通过实验研究 AI 算法在双重委托代理问题的双重合同模型中的行为,发现 AI 算法可以自主学会设计可以激励合规的合同,而在合同中,一方可以采取勾结或竞争等多态行为,而且欺骗行为似乎并不存在于制定的合同中。
Abstract
With the dramatic progress of artificial intelligence algorithms in recent
times, it is hoped that algorithms will soon supplant human decision-makers in
various fields, such as contract design. We analyze the po
AI 对齐通常被认为是设计者和人工智能代理之间的互动,在这个互动中,设计者试图确保代理的行为与其目的保持一致,风险仅因设计者意图的效用函数与代理的内部效用函数之间的无意对齐冲突而产生。然而,我们认为,随着大型语言模型(LLMs)的出现,其中通常进行预训练,这种解释并没有捕捉到人工智能安全的关键因素,因为在现实世界中,设计者和代理之间并不存在一对一的对应,许多人工智能代理和人类具有异质的价值观,因此,AI 安全具有经济学上的一面,而且原则代理问题很可能出现。