BriefGPT.xyz
Ask
alpha
关键词
hierarchical agent
搜索结果 - 3
子目标蒸馏:提升小型语言代理的方法
通过层次化代理模型和知识蒸馏,将大型语言模型的性能通过转移学习到小型语言模型,在科学世界的多任务交互文本环境中胜过其他大型语言模型方法,从而提高了效率。
PDF
2 months ago
LLM 增强分层代理
利用强化学习解决长期和拓展性任务很具挑战性,特别是在没有先验知识的情况下,为了提高样本效率,本文通过利用 LLMs 的规划能力结合强化学习的环境学习,构建了一个层次化代理,用于解决长期任务,并在 MiniGrid、SkillHack 和 C
→
PDF
8 months ago
基于强化学习的可扩展基于碎片的三维分子设计
本文提出了一种基于强化学习框架的分层代理方法,能够在三维空间中逐步放置分子亚结构,从而高效地学习如何建造具有不同分布的分子,包括药物样分子、有机发光二极管分子和生物分子,只利用能量考虑即可。
PDF
2 years ago
Prev
Next