Oct, 2020

元训练智能体实现贝叶斯最优智能体

TL;DR该研究通过在一些预测和赌博任务上的实验,发现元学习可以作为近似数值逼近贝叶斯最优智能体的一般技术。实验结果表明,memory-based meta-learning可以使一些不可解的任务变得可解。