BriefGPT.xyz
Ask
alpha
关键词
task success rates
搜索结果 - 3
AutoManual: 通过互动环境学习,由 LLM 代理生成指南手册
通过自动生成规则和提高适应性,AutoManual 框架使基于大型语言模型(LLM)的代理能够自主构建自身的理解并适应新的环境。在 ALFWorld 基准任务上,通过 GPT-4-turbo 和 GPT-3.5-turbo,AutoManu
→
PDF
a month ago
一次性模仿学习:姿势估计视角
本文研究了在只有一个示范、没有进一步的数据收集和没有先前的任务或对象知识的挑战性环境下的模仿学习,并展示了如何在这些限制条件下将模仿学习表述为轨迹转移和未见物体姿态估计的组合。通过对十个真实世界任务进行一次性模仿学习,我们深入研究了最先进的
→
PDF
9 months ago
利用检测和恢复计划执行失调来使语言模型回归基础
本文提出了 DoReMi,这是一个新颖的语言模型基础框架,旨在检测计划和执行之间的不一致并从中恢复,实验表明,与其他模型相比,DoReMi 可以提高任务成功率并缩短任务完成时间。
PDF
a year ago
Prev
Next