Jun, 2017

带有弱遗憾的对决神经网络

TL;DR本文研究了针对在线内容推荐中的比较对策问题的两类后悔概念,提出了一种新算法Winner Stays,并在模拟和实际数据方面进行了实验,结果显示WS算法在弱后悔和强后悔方面都显著优于现有算法。