BriefGPT.xyz
大模型
Ask
alpha
关键词
decision-making agents
搜索结果 - 3
CleanDiffuser:一个易于使用的模块化扩散模型库在决策中的应用
CleanDiffuser 是首个专为决策算法设计的扩散模型库,通过提供简单灵活的构建模块实现各种扩散模型算法,并进行全面评估,为未来研究打下坚实基础。
PDF
21 days ago
通过强化学习将大型视觉语言模型细调为决策代理
使用强化学习对视觉语言模型进行微调,提出了一种算法框架来增强其决策能力,验证了连续思维推理的重要性,并展示了在各种任务中超越商业模型的性能。
PDF
2 months ago
CivRealm: 文明中的学习和推理之旅用于决策智能体
通过 CivRealm 环境,本论文介绍了决策代理的学习和推理两个基本要素,以及在互动环境中学习和推理之间的平衡问题。
PDF
5 months ago
Prev
Next