BriefGPT.xyz
Ask
alpha
关键词
decision transformer under random frame dropping
搜索结果 - 1
ICLR
随机帧丢失下的决策变换器
本文提出了一种名为 “基于随机帧丢失的决策变换器” 的离线强化学习算法,可以使代理在帧丢失场景下稳健地行动,同时不需要在线交互数据,该算法通过随机掩蔽离线数据并显式地添加帧丢失的时间跨度作为输入,使用相同的离线数据集进行微调,可以在严重的帧
→
PDF
a year ago
Prev
Next