BriefGPT.xyz
Ask
alpha
关键词
semi-bandit setting
搜索结果 - 1
单调随机优化的半强盗学习
通过提供一种具有与最佳近似算法(在已知分布下)相对于平方根的 T 乘以 log T 束缚的通用在线学习算法,在半探测器环境中解决了在一大类 “单调” 随机问题中对于未知分布是否能够获得良好(近似)算法进行学习的问题。我们的框架适用于随机优化
→
PDF
6 months ago
Prev
Next