May, 2018

通过辩论实现人工智能安全

TL;DR通过采用自我对弈的零和辩论游戏的方式来训练智能体,以此作为人类判断的替代,来实现 AI 系统对于复杂任务的精准输出,并讨论了辩论模型的理论和实践方面的问题。