Oct, 2022

查询智能体:通过认知不确定性估计提高样本利用效率

TL;DR本研究提出了一种名为“Query The Agent(QTA)”的新算法,它通过在状态空间中估计代理的认识不确定性并在高度不确定的区域中设定目标来显著提高样本效率。 QTA利用一种名为“Predictive Uncertainty Networks(PUN)”的新技术来估计认知不确定性,以便在所有先前观察到的状态下对代理的不确定性进行评估。我们证明QTA相对于现有方法具有决定性的样本效率提高。