BriefGPT.xyz
Ask
alpha
关键词
instruction synthesis
搜索结果 - 3
WILBUR:面向强健与准确网络代理的自适应上下文学习
Wilbur 使用可微分的排名模型和新颖的指令合成技术来优化黑盒大型语言模型的提示,通过从先前运行中的任务演示集合中获取任务演示,以实现最大化端到端成功率,并提供智能回溯机制以从错误中学习和恢复。Wilbur 在 WebVoyager 基准
→
PDF
3 months ago
LLM 能生成类似人类的路线指引吗?迈向平台无关的具身指导综合
我们提出了一种在多个仿真平台上生成 ' 类人 ' 指令的基于 LLM 的方法,该方法不依赖于任何形式的训练,通过少数参考即可使用上下文学习来生成指令。
PDF
4 months ago
通过指导提升结构化探索实现物体导航
本文提出了一种层次化学习方法,包括高层的规划和记忆以及低层的房间导航和物品寻找,通过简单的合成语言为代理提供指令,同时使用另一个目标评估模块将指令映射到视觉观察中。在一个动态可配置的家庭环境中验证了该方法的有效性。
PDF
2 years ago
Prev
Next