关键词multi-arm bandit
搜索结果 - 7
  • 行动消失下的弱监督学习
    PDF10 days ago
  • 社交网络中减少极端化倾向
    PDFa year ago
  • 通过 K-Arm 优化进行深度神经网络的后门扫描
    PDF3 years ago
  • 深度强化学习中的战术乐观主义和悲观主义
    PDF3 years ago
  • NIPS一种用于选择强化学习智能体的赌博机框架
    PDF5 years ago
  • 带有补偿的多臂赌博机
    PDF6 years ago
  • 模拟器:理解中等置信度下的自适应采样
    PDF7 years ago
Prev
Next