Mar, 2023

使用循环神经网络和模型无关强化学习进行未知环境中的主动假设检验

TL;DR该研究提出一种深度强化学习和监督学习相结合的方法,用于解决在完全未知环境中的主动顺序假设测试问题。结果表明,与 Chernoff 测试相比,该方法在有限和无限视野问题中表现出竞争力并有时表现更好。