BriefGPT.xyz
Ask
alpha
关键词
value learning
搜索结果 - 2
高速公路图在强化学习中的加速
为了提高 RL 算法的训练效率,本研究基于高速公路图的观察,提出了一种新颖的图结构,用于模拟状态转换,将 RL 训练在早期阶段显著加速,并在性能上优于其他无模型和带模型的 RL 算法。同时,基于高速公路图训练的深度神经网络代理具有更好的泛化
→
PDF
2 months ago
IJCAI
面部价值评估:使用面部表情和强化学习训练用户界面
本文研究了如何通过面部表情感知学习来降低人机交互中的显式反馈,取得了较好的实验效果,该方法可为人机交互领域提供辅助
PDF
8 years ago
Prev
Next