BriefGPT.xyz
Ask
alpha
关键词
spectral-based methods
搜索结果 - 1
低秩强化学习光谱逐项矩阵估计
研究低秩结构引发的强化学习中的矩阵估计问题,通过简单的基于谱的方法高效地恢复矩阵的奇异子空间并实现最小的逐项误差,从而设计了充分利用低秩结构的强化学习算法,包括低秩赌博机问题的最小遗憾算法和低秩马尔可夫决策过程中的无奖励 RL 的最佳策略识
→
PDF
9 months ago
Prev
Next