AAAINov, 2020

具有自修改能力的有界理性智能体性能

TL;DR我们调查了受限理性的代理如何随着时间的推移受到自我修改的负面影响,分析了其大小与代理的理性失误的类型和严重程度之间的关系,其中特别指出在选择非最佳行为的情况下可能会出现指数级错误对齐的情况。