BriefGPT.xyz
Ask
alpha
关键词
margin condition
搜索结果 - 1
ICML
阈值套索强化学习算法
本文提出一种基于阈值套索算法的 regret minimization 解决方案,能够更好地应对稀疏随机上下文线性赌博机问题,且不需要对稀疏度等参数有先验知识,理论上的性能约束也有所提高。
PDF
4 years ago
Prev
Next