May, 2022

CAMEO: 基於好奇心擴增的都市探索最優策略

TL;DR本文介绍了一种基于好奇心的Metropolis算法(CAMEO),用于采样解决环境控制问题的多个最优策略,使其展现出不同的行为和风险属性,为实用和可解释性应用提供基础,也为学习多个最优策略的分布打下了第一步基础。