BriefGPT.xyz
大模型
Ask
alpha
关键词
sample complexity bounds
搜索结果 - 23
一种适用于情节式 POMDP 的 PAC RL 算法
本文研究了部分可观的强化学习问题,并提出了首个具有多项式边界的算法,用于处理一类重要的 POMDP 问题,该算法基于最近的方法学方法来估计潜在变量模型。
PDF
8 years ago
NIPS
固定视界强化学习的样本复杂度
本文研究了固定时间段内交互式学习智能体的表现,并从样本复杂度的角度提出了上下 PAC 确定性保证边界,为固定时间段内 MDP 的研究提供了理论上的支持。
PDF
9 years ago
线性与非线性观测的稀疏信号处理:一种统一的香农理论方法
在本文中,我们使用渐近信息理论分析,为线性和非线性观测模型包括稀疏回归、分组测试、多元回归和存在缺失特征的问题,推导了恢复稀疏和结构化信号的基本样本复杂度界限,为一般稀疏信号处理模型提供了足够和必要的条件。
PDF
11 years ago
Prev
Next