MMOct, 2018
使用深度学习的主动序贯假设检验政策设计
Policy Design for Active Sequential Hypothesis Testing using Deep Learning
Dhruva Kartik, Ekraam Sabir, Urbashi Mitra, Prem Natarajan
TL;DR该研究使用基于深度学习的启发式和 KL 分歧零和游戏设计方法来解决部分可观测马尔可夫决策过程中的主动序贯假设测试问题,并表明在某些情况下所提出的启发式方法优于现有方法。