Sep, 2021

离线评估的状态相关性

TL;DR本文提出了OSIRIS方法,它可以通过删除某些状态的可能性比率来降低重要性抽样估计器的方差,从而使其具有更高的效率和相对较少的假设。