关键词function approximation
搜索结果 - 161
  • 自信自然策略梯度用于 $q_π$ 可实现受限 MDP 中的本地规划
    PDF8 days ago
  • KDD使用 Transformer 进行多变量系统中的单变量骨架预测
    PDF9 days ago
  • rKAN: 理性 Kolmogorov-Arnold 网络
    PDF14 days ago
  • 线性贝尔曼完备性足以实现少动作高效在线强化学习
    PDF17 days ago
  • 语音化机器学习:重新审视用语言模型进行机器学习
    PDFa month ago
  • Q 学习作为单调方案
    PDFa month ago
  • 神经网络的近似和梯度下降训练
    PDFa month ago
  • ICML免模型强化学习中的 $φ$- 散度使用离线和在线数据
    PDF2 months ago
  • ICLR高效学习具有普适函数逼近的无限视野平均奖励马尔可夫决策问题
    PDF2 months ago
  • 先验依赖的函数逼近后验采样强化学习分析
    PDF4 months ago
  • 分布鲁棒离线强化学习的极小极大最优和计算高效算法
    PDF4 months ago
  • 机器学习优化的正交基分段多项式逼近
    PDF4 months ago
  • Transformer 对于回归问题是否表达能力足够?
    PDF4 months ago
  • 分布鲁棒离轨强化学习:通过线性函数逼近的证明效率
    PDF4 months ago
  • 无需流行学习的流形上的学习
    PDF4 months ago
  • 最佳逼近的随机投影神经网络:收敛理论和实际应用
    PDF5 months ago
  • 离线强化学习中的奖励污染攻击
    PDF5 months ago
  • 分布受益的更多好处:强化学习的二阶边界
    PDF5 months ago
  • 有限时间分析下的平均奖励 MDP 函数逼近中的 Critic-Actor
    PDF5 months ago
  • 利用函数逼近进行实验规划
    PDF6 months ago
Prev