BriefGPT.xyz
Ask
alpha
关键词
trial-and-error
搜索结果 - 4
上下文决策变换器:通过分层思维链强化学习
提出了一种高层次的基于试错的方法,通过在环境中提供任务提示来实现离线强化学习的上下文学习,可以更高效地解决在线任务,并在长期任务中取得了最先进的结果。
PDF
a month ago
超越计算复杂度的试错动态行为与智能
本文旨在探讨计算机科学中的计算复杂性问题,提出了智能科学的思路和方法,运用试错和动态搜索的框架将 NP 完备问题 Number Partition Problem 作为案例进行讨论。
PDF
2 years ago
ICLR
现场策略迭代
本文提出了一种名为 ICPI 的算法,它使用基础模型在上下文中执行强化学习任务,通过试错交互更新提示内容,以实现无需专家示范或梯度的强化学习任务。
PDF
2 years ago
机器人损伤恢复的无重置试错学习
该论文提出了一种名为 “Reset-free Trial-and-Error” 的新型学习算法,有效解决了复杂机器人在面对硬件损坏后无法恢复运动能力的问题,而且该算法实现自主学习,能够在不同环境中快速适应。
PDF
8 years ago
Prev
Next