BriefGPT.xyz
Ask
alpha
关键词
mask-based sensitivity analysis
搜索结果 - 1
ICCV
从视频中学习识别强化学习的关键状态
最近的深度强化学习研究指出,即使缺乏关于执行动作的显式信息,也可以从离线数据中提取有关良好策略的算法信息。本文介绍一种名为 Deep State Identifier 的新方法,该方法通过编码为视频的剧集学习预测回报,并利用一种基于掩码的敏
→
PDF
a year ago
Prev
Next