BriefGPT.xyz
Ask
alpha
关键词
unknown transition
搜索结果 - 3
改进的对抗性线性混合马尔可夫决策过程算法:带有赌博反馈和未知状态转移
我们研究了采用线性函数逼近、未知转移和对抗性损失函数的强化学习算法在强化学习环境下。
PDF
4 months ago
利用多实例弱监督学习潜在模型
本文针对监督信号由多输入实例上的标签的转移函数 σ 生成的弱监督学习方案,提出了多实例偏标签学习(multi-instance PLL)问题,并给出了对于可能的未知转移 σ 的第一理论分析。通过使用一种在神经符号学中广泛使用的顶部 - k
→
PDF
a year ago
ICML
在对手成本和未知转移情况下以低遗憾寻找随机最短路径
本文主要研究随机最短路径问题中的对手成本和未知转移,并提出了一种新的算法,可以在有限的次数内找到最优解,此外,我们还提出了一种新的算法,可以在特定情景下近似达到最优解。
PDF
3 years ago
Prev
Next