BriefGPT.xyz
Ask
alpha
关键词
monte carlo estimate
搜索结果 - 2
直接摊销似然比估计
我们引入了一种新的摊销似然比估计器,用于无似然模拟推理(SBI),引入了一种称为直接神经比率估计器(DNRE)的模型,对先前的方法进行了改进,并在文献中与其他估计器进行了比较,同时实现了一个新的导数估计器,使得我们可以比较无似然哈密顿蒙特卡
→
PDF
8 months ago
AAAI
大规模推荐的快速离线策略优化
本研究采用 Monte Carlo 梯度的新估计方法,结合 SNIS 重要性采样估计和快速的最大内积搜索方法,解决了离线最大内积搜索的问题,提出了一个新的策略学习算法。与传统算法相比,该算法在速度和性能方面均得到了优化。
PDF
2 years ago
Prev
Next