Mar, 2018

分类好哈特定律的变体

TL;DR本文探讨了利用指标来优化系统时可能导致系统失效或产生不良反应的不同机制,这种失效现象被称为 Goodhart's Law,对其进行的讨论对于更好理解这些类型的经济调节、公共政策、机器学习和人工智能对齐等方面的失败具有帮助,由于人工智能的优化能力很强,因此 Goodhart 的影响尤其重要。