Feb, 2024

一个对于价值引入问题的荷尔蒙方法:预防纸夹子末日?

TL;DR通过使用激素调节分析来调节人工智能的行为模式,HALO(激素调节对立过程)提出了一种监管范式以解决价值加载问题。HALO 通过量化可重复行为的激素限制来规范人工智能的行为,并在解决 ' 纸夹子最大化器 ' 情景中展示其有效性。