MMOct, 2018

使用深度学习的主动序贯假设检验政策设计

TL;DR该研究使用基于深度学习的启发式和 KL 分歧零和游戏设计方法来解决部分可观测马尔可夫决策过程中的主动序贯假设测试问题,并表明在某些情况下所提出的启发式方法优于现有方法。