关键词variance reduction
搜索结果 - 146
  • 多样性路径导引用于重要性采样镜面链
    PDF9 months ago
  • 自适应 Polyak 步长和线性搜索的 SGD 算法:稳健收敛和方差降低
    PDFa year ago
  • 具有大行动空间的离策评估的双重稳健估计方法
    PDFa year ago
  • 蒙特卡洛模拟和最大最优传输中的政策梯度最优相关搜索用于方差缩减
    PDFa year ago
  • 时差动力学的特征子空间及其在强化学习中改善价值估计的应用
    PDFa year ago
  • 基于探测器的重要性采样的大规模图像集计数
    PDFa year ago
  • 知识蒸馏在部分方差降低方面发挥作用
    PDFa year ago
  • 短预热期折扣 MDP 的遗憾最优免模型强化学习
    PDFa year ago
  • 控制变量切片 Wasserstein 估计器
    PDFa year ago
  • MCMC 中神经控制变量的理论保证
    PDFa year ago
  • SPeC: 基于软提示的校准方法,用以缓解临床笔记摘要中的性能变化
    PDFa year ago
  • Taylor TD-learning
    PDFa year ago
  • 随机变量度量近端梯度算法及方差约减在非凸复合优化中的应用
    PDF2 years ago
  • AAAI通过状态抽象将边缘重要抽样扩展到高维状态空间
    PDF2 years ago
  • AAAI推广线性模型的耐腐败算法
    PDF2 years ago
  • 有效高效采样图神经网络的分层估计
    PDF2 years ago
  • 快速异构联邦学习与混合客户端选择
    PDF2 years ago
  • 机器翻译中的鲁棒增强学习 MAD
    PDF2 years ago
  • ICML使用间隔的直通估计器训练离散深度生成模型
    PDF2 years ago
  • 控制变量的多保真度强化学习
    PDF2 years ago