Jun, 2022

参数可重定向决策者倾向于追求权力

TL;DRAI代理程序的获取权力以及其学习策略有助于在实际环境中寻求权力,这可能会带来一些安全风险。