BriefGPT.xyz
Ask
alpha
关键词
discrete actions
搜索结果 - 2
在行动中联系多模态大型语言模型
通过研究行为空间适配器,我们发现多模态大型语言模型在融入多种方法并处理连续行为和离散行为时可以获得最佳性能。
PDF
24 days ago
大规模离散动作空间下的深度强化学习
本文提出一种基于近似最近邻方法和先前关于行动的信息的强化学习算法,将大量离散行动嵌入到连续空间中,从而实现对大规模学习问题的解决。
PDF
9 years ago
Prev
Next