关键词decision transformer
搜索结果 - 17
- 蝰蛇作为决策者:探索离线强化学习中的多尺度序列建模PDFa month ago
- 决策变压器作为部分可观测连续控制的基础模型PDF3 months ago
- 决策玛巴:有选择性状态空间的序列建模强化学习PDF3 months ago
- 离线安全强化学习的时态逻辑条件决策变压器PDF4 months ago
- 回归对齐决策转换器PDF5 months ago
- Context-Former: 通过潜在条件序列建模图像拼接PDF5 months ago
- 使用决策 Transformer 解决持续离线强化学习PDF6 months ago
- 通过层次强化学习重新思考决策 TransformerPDF8 months ago
- 决策 ConvFormer: 元前馈中的局部过滤足以进行决策PDF9 months ago
- 使用合成数据进行预训练有助于离线强化学习PDF9 months ago
- 面向随机驾驶环境的不确定性感知决策变换器PDF9 months ago
- ACT:通过优势调节实现决策变换的动态规划赋能PDF10 months ago
- 使用离线强化学习与人类反馈对齐语言模型PDF10 months ago
- Waypoint Transformer:通过中间目标的监督学习进行强化学习PDFa year ago
- 揭开 ARC 难题:基于物体中心的决策 Transformer 的模仿人类解决方案PDFa year ago
- 使用因果反事实推理的迁移学习在决策 Transformer 中的应用PDF3 years ago
- 决策变压器:通过序列建模的强化学习PDF3 years ago
Prev
Next