关键词regret minimization
搜索结果 - 122
  • 在线堆叠伯格优化与非线性控制
    PDF7 days ago
  • 对抗性多路决斗者
    PDF16 days ago
  • 元强化学习中的测试时后悔最小化
    PDFa month ago
  • 优化夏普比率:多臂赌博机中的风险调整决策
    PDFa month ago
  • 具有网络干扰的多臂赌博机
    PDFa month ago
  • 通过鞍点优化实现遗憾最小化
    PDF4 months ago
  • 停止依赖无选择,不要重复移动:商品组合优化的最优、高效和实用算法
    PDF4 months ago
  • 低秩赌博机的紧致二至无穷奇异子空间恢复
    PDF4 months ago
  • ICLR超越最坏情况攻击:非劣政策下的自适应防御强化学习
    PDF4 months ago
  • 动态定价和长期参考效应的学习
    PDF4 months ago
  • 优化最小后悔度的无监督环境设计
    PDF4 months ago
  • 优化自适应实验:遗憾最小化和最佳臂识别的统一方法
    PDF5 months ago
  • 上下文多臂赌博机的树集成
    PDF5 months ago
  • 光滑 MDPs 中的无悔强化学习
    PDF5 months ago
  • 决策导向的预测:悲观双层优化的计算研究
    PDF6 months ago
  • 有限资源下的偏好学习复杂性理解
    PDF6 months ago
  • 博弈中协作学习的最优遗憾界
    PDF7 months ago
  • 通过遗憾最小化进行 AI 安全的辩论
    PDF7 months ago
  • 无模型的后验采样通过学习率随机化
    PDF8 months ago
  • 具有对抗性干扰的线性时不变系统分布式在线控制的遗憾分析
    PDF9 months ago
Prev